AmostrAgem em InventárIo FlorestAl
Transcript of AmostrAgem em InventárIo FlorestAl
AmostrAgem em InventárIo FlorestAl
Waldenei Travassos de Queiroz
BELÉM2012
mInIstérIo dA educAçãomInIstro: Fernando Haddad
unIversIdAde FederAl rurAl dA AmAzônIA reItor: Sueo Numazawa
vIce-reItor: Paulo de Jesus Santos
edItorAçãoMarly Maklouf dos Santos Sampaio
comIssão edItorIAlGracialda Costa Ferreira
Israel Hidenburgo Aniceto CintraMaria Cristina Manno
Moacir Cerqueira da SilvaSérgio Antonio Lopes de Gusmão
equIpe edItorIAlInácia Faro Libonati
Adriana AmaroRoseneli Lima
cApA
Waldenei Travassos de QueirozOberdan Müller Moraes das Flores
endereçoAv. Tancredo Neves, 2501, CEP: 66077-830- Montese
E-mail: [email protected]
Queiroz, Waldenei Travassos de Amostragem em inventário florestal / Waldenei
Travassos de Queiroz. -- Belém: Universidade Federal Rural da Amazônia, 2012.
441 p.: il. ISBN 978-85-7295-070-1
1. Inventário florestal. I. Título. CDD - 634.928
À Izabel, minha esposa.
Aos meus filhos Anderson e Alex,às minhas noras Lorena e Alessandra.
Aos meus pais Wagner e Erecina (in memoriam)
AgrAdecImentos
À Marly Maklouf dos Santos Sampaio, Editora Executiva da UFRA, pelo empenho na publicação deste livro, assim como à Sra. Inácia Faro Libonati e às Srtas. Adriana Amaro e Roseneli Lima pela cuidadosa revisão do texto final.
Ao Serviço Florestal Brasileiro, na pessoa do Engenheiro Florestal Joberto de Freitas Veloso, pelo convite para participar dos eventos que culminaram na construção do Projeto do Inventário Florestal Nacional do Brasil.
Agradecemos ao Professor Sylvio Péllico Netto da UFPR e aos professores da ESALQ/USP: Cassio Roberto de Melo Godoi, Humberto de Campos e Frederico Pimental Gomes (in memoriam), pelos conhecimentos que recebemos na área da teoria da amostragem, em nossa formação pós-graduada.
Somos gratos aos revisores deste trabalho: Ao Estatístico Edson Marcos Leal Soares Ramos, Doutor em Estatística e Professor da Faculdade de Estatística da Universidade Federal do Pará, e ao Engenheiro Florestal Fernando Cristóvam da Silva Jardim, Doutor em Ciências Florestais e Professor Associado da UFRA. Agradecemos aos Estatísticos: João Guimarães Pinheiro e Mário Diego Valente da Rocha, bem como ao Engenheiro Florestal Oberdan Müller Moraes das Flores, pelas sugestões e críticas; e a todos que nos incentivaram na tarefa de oferecer aos usuários da teoria da amostragem aplicada ao planejamento de inventários florestais uma obra que reúne algumas experiências condizentes, principalmente, com as condições impostas pelos tipos florestais ocorrentes no Brasil.
Agradecemos, de forma especial, ao Professor Lúcio Salgado Vieira (in memoriam), mestre na arte real que fundamenta
as bases das relações humanas, que pelos seus exemplos nos ensinou a descobrir os segredos da nossa missão de vida.
Se a matemática é o pincel com que Deus desenhou o universo, então, a estatística é a ferramenta humana criada para tentar entendê-lo!
Waldenei Travassos de Queiroz
sumárIo
preFácIo ..............................................................................13
ApresentAção ...................................................................15
cApítulo 1 - Introdução Ao InventárIoFlorestAl ..................................................................................17
cApítulo 2 - InventárIo e mAnejo FlorestAl ........23
cApítulo 3 - FundAmentos de estAtístIcA ..............293.1 DEFINIçõES.....................................................................313.2 PONTO AMOSTRAL E ESPAçO AMOSTRAL ..................313.3 VARIáVEL ALEATóRIA .....................................................323.4 ESPERANçA MATEMáTICA ............................................323.5 DISTRIBUIçãO DE PROBABILIDADE .............................333.5.1 Função de probabilidade de variáveis discretas.......333.5.2 Função densidade de probabilidade de variáveis contínuas .................................................343.5.3 Função de distribuição acumulada ou função de distribuição .................................................343.5.4 distribuição binomial ...................................................353.5.5 distribuição de poisson...............................................373.5.6 distribuição normal ......................................................393.5.7 distribuição de c2 .........................................................433.5.8 distribuição “t” de student ........................................463.5.9 distribuição “F” de snedecor .....................................50
cApítulo 4 - AmostrAgem sImples Ao AcAso .........534.1 VALORES POPULACIONAIS E ESTIMADORES .............574.2 AMOSTRAGEM SIMPLES AO ACASO PARA PROPORçõES E PORCENTAGENS ..............................71
4.2.1 valores populacionais, estimadores edimensionamento da amostra..............................................73
cApítulo 5 - AmostrAgem estrAtIFIcAdA ................795.1 VALORES POPULACIONAIS E ESTIMADORES POR ESTRATO .................................................................835.2 VALORES POPULACIONAIS E ESTIMADORES CONSIDERANDO TODOS OS ESTRATOS .....................875.3 PRECISãO DA AMOSTRA ESTRATIFICADA EM RELAçãO À AMOSTRA SIMPLES AO ACASO................955.4 INVENTáRIO FLORESTAL APRESENTANDO SUBPOPULAçõES COM DIFERENTES INTENSIDADES DE AMOSTRAGEM ............................. 112
cApítulo 6 - AmostrAgem sIstemátIcA .................. 1176.1 VARIâNCIA DA MÉDIA ....................................................1226.2 PRECISãO DA AMOSTRA SISTEMáTICA COMPARADA À AMOSTRA SIMPLES AO ACASO ........124
cApítulo 7 - estImAtIvAs por rAzão ........................1377.1 ESTIMATIVAS POR RAzãO COM IGUAL PROBABILIDADE .................................................1397.2 ESTIMATIVAS POR RAzãO CONSIDERANDO PROBABILIDADE PROPORCIONAL (AAP) À VARIáVEL AUxILIAR (x) .................................................1497.3 ESTIMATIVAS POR RAzãO: AMOSTRAGEM INVERSA COM PROBABILIDADE PROPORCIONAL À VARIáVEL AUxILIAR x (AIPP) ....................................1567.4 ESTIMATIVAS POR RAzãO CONSIDERANDO A AMOSTRAGEM ESTRATIFICADA .................................1577.5 DUPLA AMOSTRAGEM: FASES DEPENDENTES ........1707.6 COMPARAçãO DE DOIS íNDICES OU DUAS RAzõES ........................................................175
cApítulo 8 - estImAtIvAs por regressão .............1818.1 PARâMETROS POPULACIONAIS E ESTIMADORES ...1838.2 ESTIMATIVAS POR REGRESSãO CONSIDERANDO A AMOSTRA ESTRATIFICADA AO ACASO ....................202
cApítulo 9 - AmostrAgem por conglomerAdo....2319.1 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO ......................................................2359.1.1 parâmetros populacionais e estimadores ...............2359.2 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO COM UNIDADES DE GRANDEzAS DESIGUAIS..............................................2419.2.1 parâmetros populacionais e estimadores ...............2419.3 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO PELAS PROPORçõES......................2549.3.1 valores populacionais e estimadores ......................2559.4 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS ......................................................2619.4.1 componentes de variâncias no modelo inteiramente ao acaso ...............................................2619.4.2 parâmetros populacionais e estimadores ...............2679.4.3 ocorrência de estimativa negativa do componente de variância entre conglomerados ).(ˆ yVe ) ..................2809.5 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS COM GRANDEzAS DESIGUAIS .................2959.5.1 valores populacionais e estimadores ......................2959.6 CONGLOMERADOS EM DOIS ESTáGIOS: ANáLISE ESTATíSTICA CONSIDERANDO A OCORRêNCIA DE TIPOLOGIAS DIFERENTES NA SUBPARCELA ............3009.6.1 valores populacionais e estimadores ......................3019.7 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS: ANáLISE ESTATíSTICA CONSIDERANDO A OCORRêNCIA DE UMA VARIáVEL AUxILIAR ...........3059.7.1 valores populacionais e estimadores ......................306
9.8 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS PELAS PROPORçõES ................................3229.8.1 valores populacionais e estimadores ......................3229.9 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS PELAS PROPORçõES COM GRANDEzAS DESIGUAIS (Mi ) .............................................................3269.9.1 valores populacionais e estimadores ......................3269.10 ESTRUTURAS DE CONGLOMERADOS EM INVENTáRIOS FLORESTAIS .......................................3299.11 AMOSTRAGEM POR CONGLOMERADOS EM TRêS ESTáGIOS ...........................................................3399.11.1 valores populacionais e estimadores.....................3419.11.2 parâmetros populacionais e seus estimadores através da análise de variância ...............................343
cApítulo 10 - InventárIo FlorestAl contínuo ...36310.1 MÉTODO DE ANáLISE DE PARCELAS SUBDIVIDIDAS ...36710.2 MODELO DE AMOSTRAGEM COM SUBSTITUIçãO PARCIAL ............................................38410.2.1 estimador Asp de xµ e sua variância )ˆ( xV µ ..........38510.2.2 estimador Asp de yµ e sua variância )ˆ( yV µ .........38910.2.3 covariância entre os estimadores Asp xµ e
yµ ...39010.2.4 estimador Asp de dµ e sua variância )ˆ( dV µ .........391
cApítulo 11 - FormA e tAmAnho dAsunIdAdes de AmostrA ...................................................40311.1 MÉTODOS PARA OBTER O TAMANHO IDEAL ...........408
consIderAções FInAIs ..................................................413
reFerêncIAs .....................................................................419
glossárIo .........................................................................425
Anexo ..................................................................................435
preFácIo
O livro Amostragem em Inventário Florestal foi elaborado para servir como um guia prático para profissionais e estudantes de graduação e pós-graduação que necessitam dos conhecimen-tos e da teoria de estatística. Sua forma de abordagem apresenta uma grande revisão dos conhecimentos básicos de probabilidade e estatística, podendo, desta forma, ser utilizado como texto em diversos cursos de graduação e pós-graduação, como por exem-plo, cursos de Engenharia Florestal, Agronomia e Estatística.
De fato, o livro serve como instrumento para o aprimora-mento das análises dos levantamentos florestais. Em seus ca-pítulos são abordadas as mais importantes técnicas de amos-tragem: Simples ao acaso, Estratificada, Sistemática e por Con-glomerados. Cursos de Amostragem são cada vez mais comuns em empresas e instituições de pesquisa. Assim, pensando na diversidade de aplicações dos conhecimentos advindos dessas técnicas, esta obra mostra-se como uma contribuição ao assun-to com a profundidade e o rigor técnico necessários.
Além disso, como o Inventário Nacional do Brasil come-çará a ser executado neste início de década, utilizando o proce-dimento por Conglomerados, a obra Amostragem em Inventá-rio Florestal configura-se como um importante suporte técnico àqueles que irão executar esta tarefa, pois é evidente que o In-ventário Nacional do Brasil não será tratado por meio de uma simples análise, visto a grande diversidade florística e extensão territorial brasileira. Desta forma, as técnicas abordadas no livro, como por exemplo, as análises associadas de estimativas por razão e por regressão, poderão ser melhores compreendidas.
A partir da experiência do autor em procedimentos envol-vendo a Amostragem em Inventário Florestal é possível ob-servar, no texto, a boa qualidade dos exemplos e dos exercícios resolvidos, além disso, o livro apresenta uma coleção de técni-cas e metodologias estatísticas reunidas numa só obra. Desta forma, professores, pesquisadores e usuários podem, então, a partir deste livro compreender e implementar cada uma das técnicas e ferramentas abordadas facilmente. Finalmente, esta obra pode ser destinada a todos aqueles que utilizam e estudam as técnicas de amostragem e seus benefícios nas diversas áre-as de conhecimento.
prof. dr. edson marcos leal soares ramos
ApresentAção
O objetivo deste livro é contribuir com conhecimentos no ensino de teoria de amostragem e no planejamento estatístico de inventários florestais. É importante que, além de servir como livro texto para os estudantes, seja também um instrumento para o aprimoramento das análises dos levantamentos florestais.
O Inventário Nacional do Brasil, que começará a ser execu-tado neste início de década, utilizará o processo de amostragem por conglomerados. É evidente que não se trata de uma análi-se simples, pois ocorrerão inúmeras situações a serem enfren-tadas, visto a grande diversidade florística, extensão territorial, entre outros. Assim sendo, análises associadas de estimativas por razão e por regressão podem ser empregadas quando os conglomerados possuírem tamanhos ou números diferentes de subparcelas.
O uso de variáveis auxiliares no processamento estatís-tico, além de permitir ganho de precisão, facilita a análise da variável resposta de interesse por tipologia florestal, onde a área de ocorrência da vegetação pode ser considerada como uma covariável.
A análise de dados proveniente do uso do processo de amostragem por conglomerados, por meio da subparcela, preci-sa ser mais discutida, visto a possibilidade da existência de de-pendência entre as subparcelas. Um procedimento alternativo é efetuar a análise considerando o conglomerado como uma uni-dade de observação, ou seja, obter as estimativas dos parâme-tros a partir da quantidade correspondente à soma dos valores observados nas subparcelas dentro de cada conglomerado.
Para os estudantes terem um melhor entendimento da
amostra por conglomerados, no sentido de aferir a sua eficácia, foi apresentada a dedução teórica do processo de obtenção dos componentes de variância entre os conglomerados e entre as subparcelas dentro de cada conglomerado.
Os componentes de variância são importantes no cálcu-lo do coeficiente de correlação intraconglomerado. Este coefi-ciente, além de medir o grau de dependência das subparcelas dentro dos conglomerados, avalia a precisão desse processo de amostragem em relação à amostra simples ao acaso. É mostra-do exercício sobre as diversas fórmulas do coeficiente de corre-lação e do cálculo dos componentes de variância, visando facili-tar as suas interpretações.
Do ponto de vista matemático, é indispensável ter algumas noções de álgebra linear e cálculo diferencial e o conhecimento de determinação de máximos e mínimos condicionados, usando, quando necessário, o método dos multiplicadores de Lagrange. Em relação à experiência em métodos estatísticos, o livro pressu-põe o conhecimento prévio de esperança matemática, de medi-das de tendência central, de medidas de dispersão e as distribui-ções: normal, “t” de Student, 2c , “F” de Snedecor, além de limites de confiança, regressão linear simples e análise de variância.
O autor, no sentido de buscar o aperfeiçoamento do livro “Amostragem em Inventário Florestal” e, assim, atender às de-mandas acadêmicas, coloca-se à disposição para o recebimen-to de críticas e sugestões.
cApítulo 1
Introdução Ao InventárIo FlorestAl
Define inventário florestal, mostrando a sua importância para a formulação de planos de utilização dos produtos flores-tais, manejo sustentado integrado da floresta, bem como para alicerçar propostas de planos de desenvolvimento e política flo-restal de caráter regional ou nacional. Apresenta um histórico resumido sobre o inventário florestal no Brasil, destacando a re-alização e os principais objetivos do Inventário Florestal Nacio-nal Brasileiro.
19
Introdução ao inventário florestal
Inventário florestal é o ramo da ciência florestal que visa avaliar as variáveis qualitativas e quantitativas da floresta e suas inter-relações, assim como dinâmicas de crescimento e suces-são florestal, servindo de base para a formulação de planos de utilização dos produtos florestais, manejo sustentado integrado da floresta, bem como para alicerçar propostas de planos de de-senvolvimento e política florestal de caráter regional ou nacional.
No sentido mais amplo, o inventário florestal pode, tam-bém, até ser planejado para avaliar outras funções da floresta como, por exemplo, as recreativas, a exploração de bacias hi-drográficas, da vida silvestre e outras possibilidades de uso do ecossistema florestal. Péllico Netto e Brena (1997) apresentam uma classificação dos inventários florestais em diversos tipos de acordo com seus objetivos, abrangência, forma de obtenção dos dados, abordagem da população no tempo e grau de deta-lhamento dos resultados.
O inventário florestal para fins de manejo florestal deve ser planejado tal que possa obter e interpretar os diversos pa-râmetros estruturais da floresta e suas inter-relações, objetivan-do subsidiar a definição dos tratamentos silviculturais e outras operações a serem executadas para obter a utilização ecológica e econômica, através da produção sustentável e contínua dos benefícios diretos e indiretos da floresta em prol da sociedade regional.
Na Amazônia brasileira, segundo SUDAM (1974), os pri-meiros trabalhos técnicos sobre inventário florestal tiveram início na década de 50 por meio dos levantamentos realizados pela missão FAO, que servia junto à Superintendência do Plano de Valorização Econômica da Amazônia - SPVEA, antecessora da atual Superintendência do Desenvolvimento da Amazônia - SU-DAM. Infelizmente, esses trabalhos não foram suficientemente
20
Amostragem em inventário florestal Waldenei Travassos de Queiroz
divulgados, e os artigos que chegaram a ser publicados foram em número reduzido de volumes e rapidamente esgotados.
Em termos de levantamentos de recursos naturais, no campo de inventário florestal de reconhecimento, a Amazônia ocupa uma posição relevante, visto os inúmeros programas exe-cutados na Amazônia brasileira, tendo-se entre os principais as pesquisas do Projeto RADAMBRASIL, os trabalhos desenvol-vidos pelo programa Polamazônia, os inventários executados para aprovação e instalação de projetos industriais, através da política de incentivos fiscais coordenada pela SUDAM, assim como os diversos levantamentos florestais realizados pelos ór-gãos públicos estaduais e federais.
Para Rollet e Queiroz (1978), os dois maiores inventários florestais de reconhecimento realizados na Amazônia brasileira são os da FAO (1956 – 1961) e os do Projeto RADAMBRASIL (1968 – 1977). O programa FAO foi dedicado, principalmente, ao estudo de uma região situada ao sul do rio Amazonas, entre os rios Madeira e Capim, em uma faixa de 150 km de largura por 1.500 km de comprimento, em direção oeste-leste, tendo sido estudadas 1.388 unidades de amostra de 1ha, abertura de 4.225 km de transectos, abrangendo a enumeração de 155.001 árvo-res, resultando em média 112 árvores por hectare, considerando os diâmetros à altura do peito (DAP) acima de 25 cm. O Proje-to RADAMBRASIL abrangeu toda a bacia amazônica brasileira com mais de 2.000 ha (amostra) levantados.
Nos anos de 1980 a 1982, no Brasil, foi realizado o inven-tário nacional dos reflorestamentos e nos anos de 1981 a 1984 o inventário das florestas naturais, mas não abrangendo a região Amazônica. Mais recentemente, os estados do Rio Grande do Sul, Minas Gerais e Santa Catarina realizaram os seus inventá-rios estaduais.
21
Introdução ao inventário florestal
O território brasileiro possui uma área aproximada de 526 milhões de hectares de florestas naturais, com ocorrência de 49% na Amazônia (350.861 km2), 10 % de Caatinga (52.269 km2), 24% de Cerrado (91.019 km2), 13% Mata Atlântica (30.167 km2), 2% Pantanal (2.679 km2), 2% Pampa (2.679 km2) e 6,6 milhões de florestas plantadas. O Brasil não pode prescindir de estabe-lecer um sistema de Inventário Florestal Nacional (IFN), visando estabelecer as condições técnicas e científicas necessárias para adoção de políticas públicas que resultem simultaneamente no desenvolvimento econômico, social e na conservação ambiental.
O Serviço Florestal Brasileiro (SFB) elaborou, com a partici-pação das comunidades técnicas, científicas em geral, o projeto do Inventário Florestal Nacional (IFN), o qual utilizará o processo de amostragem por conglomerado e deverá iniciar a sua opera-cionalização em 2011. E dentre os objetivos do IFN, destacam-se:
1) periodicamente, determinar e monitorar a cobertura flo-restal brasileira;
2) caracterizar e monitorar a diversidade da vegetação ar-bórea dos diferentes biomas brasileiros;
3) quantificar e qualificar os recursos madeiráveis, pros-pectar os recursos não madeiráveis e a qualidade dos ecossistemas por meio de indicadores;
4) determinar as mudanças da cobertura florestal ao longo do tempo;
5) gerar informações sobre o uso e importância da floresta para as populações de seu entorno;
6) gerar informações sobre áreas de preservação perma-nente e fragmentos de vegetação naturais;
7) gerar informações sobre uso e a conservação das flores-tas por meio de indicadores anuais;
22
Amostragem em inventário florestal Waldenei Travassos de Queiroz
8) fornecer informações periodicamente sobre as florestas brasileiras, agrupadas em diferentes unidades políticas, administrativas e de mapeamento, tais como: biomas, regiões fitoecológicas, Unidades da Federação e regi-ões geográficas, para subsidiar planos de desenvolvi-mento e de uso racional das florestas e seus serviços ambientais, bem como programas de revitalização de áreas degradadas e silvicultura com espécies nativas.
É importante frisar que os objetivos do IFN exigem a aplica-ção de modelagem estatística de larga amplitude metodológica e, na conjuntura atual de desenvolvimento do setor florestal bra-sileiro, é importante investir na formação de recursos humanos para a pesquisa, objetivando delinear sistemas de inventários flo-restais para apoiar as demandas do IFN e produzir delineamen-tos para alicerçar a elaboração de planos de manejo integrado de rendimento sustentável para os recursos florestais do país.
cApítulo 2
InventárIo e mAnejo FlorestAl
Mostra uma visão da aplicação do inventário florestal nas áreas de silvicultura e manejo florestal considerando a comple-xidade da diversidade florística das florestas tropicais amazôni-cas, bem como outros elementos importantes que fazem parte da estrutura de um inventário florestal direcionado à elaboração de planos de manejo para florestas naturais, assim como apre-senta alguns componentes que, obrigatoriamente, devem ser considerados no planejamento de inventários para atender tal fim.
25
Inventário e manejo florestal
Manejo florestal e Silvicultura são segmentos da ciência que estudam os princípios, técnicas e normas que visam organi-zar as ações necessárias para delinear e ordenar os fatores da produção florestal, maximizando a produtividade e a eficiência.
Produção contínua e sustentável também significa admitir que a floresta produz outros benefícios, além da madeira, depre-endendo-se que o manejo florestal deve ter como objetivo princi-pal o atendimento da demanda de madeira e de outros produtos e serviços florestais, maximizando a renda sem comprometer a cobertura florestal necessária à proteção dos solos, mananciais, biodiversidade e outras funções reguladoras da floresta.
Manejar significa administrar os recursos florestais, sendo necessário, para atingir uma boa administração, coletar, analisar e interpretar os diversos parâmetros dendrométricos, sociais, ecológicos e econômicos; estabelecer metas, programar ações e, assim, atingir os resultados esperados. Dessa forma, compete ao inventário florestal o suporte técnico e científico necessário ao silvicultor, para que sejam atingidos os objetivos propostos.
Por outro lado, deve-se considerar que, além da complexi-dade da diversidade florística das florestas tropicais amazônicas, existem outros elementos importantes que devem fazer parte da estrutura de um inventário florestal direcionado à elaboração de planos de manejo de florestas naturais. Alguns componentes que, obrigatoriamente, devem ser considerados no planejamen-to de inventários para atender tal fim, podem ser:
a) componentes ecológicos
Essas informações referem-se às associações inter e intra-específicas, que são as responsáveis pela dinâmica de cresci-mento e sucessão da floresta, as quais podem ser detectadas e
26
Amostragem em inventário florestal Waldenei Travassos de Queiroz
analisadas no inventário florestal através da análise dos vários índices de associações fitossociológicos existentes na literatura florestal. Esses índices são aqueles relacionados com a impor-tância ecológica das espécies na área em estudo.
A análise dos componentes ecológicos, atualmente nos in-ventários florestais regionais, basicamente é interpretada pelo índice do Valor de Importância das Espécies, o qual agrega os seguintes fatores:
a1) abundância por espécie: número de árvores amostrado por espécie dividido pelo número total de árvores ocor-rentes;
a2) frequência relativa: número de unidades de amostra que contém a espécie dividido pelo número total de uni-dades de amostra;
a3) dominância: a área basal de uma espécie dividida pela área basal da floresta amostrada;
b) componentes florísticos
Referem-se à composição botânica da área em estudo. O inventário florestal deverá ser dimensionado tal que assimile a ocorrência de todas as espécies existentes na área. As informa-ções sobre a composição florística, geralmente, são computa-das através da relação entre o número de espécies encontradas em função do tamanho da área amostral. O tamanho da amostra ideal a ser levantada no inventário florestal, para definir a estru-tura florística, deve ser aquele em que, aumentando-se a área amostrada, a probabilidade de ocorrer novas espécies é pratica-mente nula.
27
Inventário e manejo florestal
c) componentes dasométricos
São aqueles que explicam as relações existentes entre as diversas variáveis dendrométricas das quais, através da teoria de regressão, são obtidas diversas equações, principalmente as específicas para cubagem das árvores; relações hipsométricas e distribuições diamétricas.
d) componentes de estocagem
Os inventários florestais, em função da estrutura diamé-trica, estimam a existência de estocagem suficiente de mudas, varas e arvoretas das espécies. Essas informações visam veri-ficar se, com a retirada de árvores com dimensões comerciais, o estoque de árvores com dimensões menores será suficien-te para garantir a perpetuação das espécies em quantidade e qualidade. A distribuição diamétrica por espécie fornecerá essas informações.
Dizem respeito também à determinação da estocagem de árvores porta-sementes na floresta, para que no projeto de ma-nejo florestal, haja a possibilidade de definir as árvores que de-verão permanecer na área, de modo a garantir a perpetuação de espécies de interesse.
e) componentes qualitativos
Caracterizam a configuração qualitativa dos fustes das ár-vores com relação à sua forma, aspecto de tortuosidade e sani-dade, entre outras.
cApítulo 3
FundAmentos de estAtístIcA
Contempla definições, conceitos e aplicações práticas im-portantes no campo da estatística visando dar suporte ao enten-dimento da teoria de amostragem. Aborda os seguintes temas: ponto amostral e espaço amostral; variáveis aleatórias discretas e contínuas; esperança matemática; função de probabilidade de variáveis discretas e contínuas. Apresenta as distribuições: bino-mial, Poisson, normal, c2, “t” de Student e “F” de Snedecor.
31
Fundamentos de estatística
3.1 DEFINIçõES
Estatística é a matemática aplicada que estuda dados ori-ginados de observações.
A Estatística estuda métodos científicos para o planeja-mento de coleta, organização, resumo, apresentação e análise de dados, gerando conclusões para subsidiar a tomada de de-cisões.
A parte da Estatística referente à coleta, organização, re-sumo e apresentação de dados é conhecida como Estatística Descritiva ou Estatística Dedutiva.
A parte referente à análise e conclusão de dados denomi-na-se Inferência Estatística ou Estatística Indutiva.
3.2 PONTO AMOSTRAL E ESPAçO AMOSTRAL
Em qualquer experimento, cada acontecimento que possa ocorrer é denominado ponto amostral. A totalidade dos pontos amostrais constitui o espaço amostral ou universo. Sejam os se-guintes exemplos:
a) semeadas 100 sementes para verificar a percentagem de germinação, têm-se 101 pontos amostrais, consti-tuindo o espaço amostral;
b) a produção de madeira de uma floresta está entre 100 m3/ ha e 200 m3/ ha, assim, diz-se que o espaço amos-tral é constituído por infinitos pontos contidos no interva-lo [100 a 200].
Os espaços amostrais podem ser classificados em discre-tos e contínuos. O espaço amostral é discreto quando é consti-tuído por um número finito de pontos ou por um número infinito
32
Amostragem em inventário florestal Waldenei Travassos de Queiroz
desde que enumeráveis. O espaço amostral é contínuo quando é constituído por um conjunto infinito contínuo de pontos amos-trais.
3.3 VARIáVEL ALEATóRIA
Uma variável, definida como o símbolo representativo dos elementos de um conjunto, é dita aleatória quando associada a uma probabilidade de ocorrência. A variável aleatória pode ser classificada em discreta e contínua. A variável é discreta quando assume somente um número finito de valores ou quando varia num conjunto infinito enumerável. A variável é contínua quando assume valores que variam de acordo com um conjunto infinito não enumerável (intervalo contínuo).
3.4 ESPERANçA MATEMáTICA
Seja y uma variável aleatória discreta, assumindo os va-lores y1, y2,..., yn com as probabilidades p1, p2,..., pn, respectiva-mente. Define-se esperança matemática ou valor médio de y, como sendo:
∑=
=n
iii pyyE
1
)( para ∑=
=n
iip
1
1
Para as variáveis aleatórias contínuas, tem-se:
∫∞
∞−
= dyyfyyE )()( y f (y) dy dado que ∫
∞
∞−
=1dPdP = 1. Sendo f(y) a função
densidade.
Propriedades da esperança matemática:
E(c) = c, sendo c uma constante;
33
Fundamentos de estatística
E(cy) = c E(y); E(x + y) = E(x) + E(y); E(xy) = [E(x)][E(y)], se x e y forem independentes.
Definições de variância e de covariância.V(y) = E[y - E(y)]2; V(ay) = c2 V(y);Cov(x,y) = E{[(x - E(x)][(y - E(y)]}= E(xy) – [E(x)][E(y)], sen-
do Cov(x,y) = 0, então x e y são independentes;V(x+y) = V(x) + V(y) + 2 Cov(x,y);V(x-y) = V(x) + V(y) - 2 Cov(x,y);V(ax+by) = a2V(x) + b2V(y) + 2ab Cov(x,y), dado que a e b
são constantes;V(ax-by) = a2V(x) + b2V(y) – 2ab Cov(x,y).
3.5 DISTRIBUIçãO DE PROBABILIDADE
Denomina-se distribuição de probabilidade ao conjunto de duas variáveis: uma, é a própria variável aleatória, e a outra, as suas respectivas probabilidades de ocorrência. De conformida-de com a natureza da variável aleatória, a distribuição pode ser classificada em discreta ou contínua.
3.5.1 Função de probabilidade de variáveis discretas
Para as variáveis aleatórias discretas, uma função f(y) é de probabilidade, se:
a) f(y) 0 para qualquer y;
b) .1)(∑ =y
yf
34
Amostragem em inventário florestal Waldenei Travassos de Queiroz
3.5.2 Função densidade de probabilidade de variáveis con-tínuas
Para as variáveis aleatórias contínuas, uma função f(y) é de densidade, se:
a) f (y) 0 para qualquer y real;
b) ∫∞
∞−
= dyyfyyE )()( y f (y) dy = ∫
∞
∞−
=1dPdP = 1
O termo f (y) dy representa a probabilidade de ocorrência de valores entre y e y + dy, denominado diferencial de probabi-lidade (dP).
3.5.3 Função de distribuição acumulada ou função de distri-buição
A função de distribuição acumulada é obtida a partir da f(y), que é representada, para um determinado valor de Y, pela fun-ção f(y) = P(y Y). Assim, têm-se:
a) para variáveis discretas ;)()( ∑≤
=Yy
yfyF
b) para variáveis contínuas .)()( ∫∞−
=y
dyyfyF f (y) dy.
Toda distribuição é definida através de uma função de pro-babilidade se a variável é discreta, ou por uma função de densi-dade se a variável é contínua.
35
Fundamentos de estatística
3.5.4 distribuição binomial
É uma distribuição discreta, cuja função de probabilidade é:yny
y
nqpCyf −=)( , sendo:
p = probabilidade de realização do acontecimento favorável;q = probabilidade de realização do acontecimento contrário;y = número de vezes que se realiza o acontecimento favo-
rável;n = número de tentativas;
=y
nC número de combinações de n elementos, tomados y a y.
exercício 3.1
Em uma amostra de cinco árvores (n = 5) verificou-se a ocorrência de duas árvores (y = 2) com qualidade de fuste tipo 1 (fuste reto, cilíndrico, bem configurado e sem deterioração apa-rente). A aplicação de um teste de aderência comprovou que a variável “número de árvores” com qualidade de fuste tipo 1 segue a distribuição binomial. Obter as probabilidades de ocor-rência para y = 0, 1, 2, 3, 4, 5.
Dado que 5
2==
n
yp , então
5
31 =−= pq
a) se ynyy
nqpCyf −=)( , então a probabilidade de não ocor-
rer árvores com qualidade de fuste tipo 1 é obtida por:
0778,03125
243)
5
3()
5
2()0( 500
5 === Cf
Conclui-se que a probabilidade de não ocorrer árvores com qualidade de fuste tipo 1 é igual a 7,78%.
36
Amostragem em inventário florestal Waldenei Travassos de Queiroz
b) a probabilidade de ocorrer apenas uma árvore com qua-lidade de fuste tipo 1 é obtida por:
2592,03125
810)
5
3()
5
2()1( 411
5 === Cf
Conclui-se que a probabilidade de ocorrer uma árvore ape-nas com qualidade de fuste tipo 1 é igual a 25,92%.
c) a probabilidade de ocorrer duas árvores com qualidade de fuste tipo 1 é dada por:
3456,03125
1080)
5
3()
5
2()2( 322
5 === Cf
Conclui-se que a probabilidade de ocorrer duas árvores com qualidade de fuste tipo 1 é igual a 34,56%.
d) a probabilidade de ocorrer três árvores com qualidade de fuste tipo 1 é dada por:
2304,03125
720)
5
3()
5
2()3( 233
5 === Cf
Conclui-se que a probabilidade de ocorrer três árvores com qualidade de fuste tipo 1 é igual a 23,04%.
e) a probabilidade de ocorrer quatro árvores com qualidade de fuste tipo 1 é dada por:
0768,03125
240)
5
3()
5
2()4( 144
5 === Cf
Conclui-se que a probabilidade de ocorrer quatro árvores com qualidade de fuste tipo 1 é igual a 7,68%.
37
Fundamentos de estatística
f) a probabilidade de ocorrer cinco árvores com qualidade de fuste tipo 1 é dada por:
0102,03125
32)
5
3()
5
2()5(
055
5 ��� Cf
Conclui-se que a probabilidade de ocorrer cinco árvores com qualidade de fuste tipo 1 é igual a 1,02 %.
Note-se que:
∑=
−=+n
i
inini qpCqp
0
5 )()()(
Verificação:
10102,00768,02304,03456,02592,00778,0)5()4()3()2()1()0( =+++++=+++++ ffffff
3.5.5 distribuição de poisson
É uma distribuição discreta cuja função de probabilidade é:
!)(
y
mexf
ym−
=
Tal que y pode assumir valores y = 1,...,∞.
y = número de vezes que se realiza o acontecimento;m = média de ocorrência;e = base do logaritmo natural ou neperiano.
exercício 3.2
Usando-se parcelas de tamanho igual a 0,25 ha em um in-ventário florestal verificou-se, em média, 20 árvores, considerando
38
Amostragem em inventário florestal Waldenei Travassos de Queiroz
todas as espécies. A pesquisa cita que a probabilidade de ocorrer uma árvore da família meliaceae é 10%. Um teste de aderência comprovou que a variável resposta número de árvores ocorrentes dessa família segue a distribuição de Poisson. Calcular as proba-bilidades de ocorrência de: nenhuma árvore, apenas uma árvore, três árvores e cinco árvores da família meliaceae.
Dado que: !
)(y
mexf
ym−
= e m = p = 0,10 x 20 = 2
a) a probabilidade de ocorrer nenhuma árvore da família meliaceae é dada por:
1353,01
!0
2)0(
2
02
==×
=−
e
ef
Conclui-se que a probabilidade de ocorrer nenhuma árvore da família meliaceae é de 13,53%.
b) a probabilidade de ocorrer apenas uma árvore da família meliaceae é dada por:
2707,02
!1
2)1(
2
12
==×
=−
e
ef
Conclui-se que a probabilidade de ocorrer apenas uma ár-vore da família meliaceae é de 27,07%.
c) a probabilidade de ocorrer três árvores da família melia-ceae é dada por:
1804,06
8
!3
2)3(
2
32
==×
=−
e
ef
39
Fundamentos de estatística
A probabilidade de ocorrer três árvores da família meliace-ae é de 18,04%.
d) a probabilidade de ocorrer cinco árvores da família me-liaceae é dada por:
0361,0120
32
!5
2)5(
2
52
==×
=−
e
ef
A probabilidade de ocorrer cinco árvores da família melia-ceae é de 3,61%.
3.5.6 distribuição normal
Quando os valores das observações de uma variável res-posta, originados de uma amostra, são agrupados em tabelas de frequências, objetiva-se conhecer a variação e como se pro-cessa a distribuição dos dados.
Existem inúmeros tipos de curvas que podem representar as distribuições. Na maioria das pesquisas biológicas, as observa-ções variam em torno da distribuição normal, a qual é uma distri-buição contínua, também conhecida como distribuição de Gauss, Laplace ou Laplace-Gauss. É a mais importante distribuição no campo da Estatística e tem a seguinte função de densidade:
2])(
[2
1
2)(
1)( yS
Yy
eyS
yf−
−
=p
(3.1)
Sendo:)()( yVyS = é o desvio padrão da distribuição;
e = base do logaritmo neperiano (e = 2,7183);p = constante geométrica (p = 3,1416).A notação usada é )](,[ yVYN )], lê-se que a variável aleató-
32
40
Amostragem em inventário florestal Waldenei Travassos de Queiroz
ria contínua y tem distribuição normal com média Y e variância V(y).
A equação normal tem como representação gráfica uma curva unimodal em forma de sino, contínua, simétrica em rela-ção à origem, onde os valores da variável resposta variam de - )( ∞<<−∞ y a + )( ∞<<−∞ y , possuindo um ponto de máxima frequência. A Figura 3.1 apresenta três formas gráficas de distribuições normais apre-sentando variâncias diferentes, tal que: )()()( 321 yVyVyV << .
Figura 3.1 - Formas gráficas da distribuição normal ( )( ∞<<−∞ y < y < )( ∞<<−∞ y ).
Para determinar a área compreendida pela curva e duas ordenadas quaisquer, integra-se a equação da curva entre as ordenadas. A integração da equação normal entre - )( ∞<<−∞ y e + )( ∞<<−∞ y im-plicará na obtenção da frequência total ou probabilidade integral, igual à unidade, abrangendo a área que fica sob a curva.
∫∞
∞−
=1)( dyyf f (y) dy = 1
Por outro lado, em relação ao cálculo das probabilidades, no que concerne à integração de f(y), apresentada na forma analítica da Equação 3.1, resultam dois problemas:
41
Fundamentos de estatística
1) Para o cálculo da integral de f(y) é necessário o desen-volvimento em séries.
2) A elaboração de tabelas de probabilidade torna-se com-plicada, pois f(y) depende de dois parâmetros: Y e )(yV , acar-retando a necessidade de obter uma tabela para cada combina-ção de Y e )(yV .
Esses problemas são solucionados através de uma trans-formação de variável, surgindo, assim, a distribuição normal pa-dronizada ou reduzida de média zero e variância igual à unidade:
)()( ySYyz −=Na construção da variável z, y é uma variável normal de
média Y e variância )(yV . A variável aleatória contínua z tem distribuição normal, denominada de padronizada ou reduzida de média zero e variância igual a 1, pois:
0][)( )( == −
ySYyEzE e 1][)( )( == −
ySYyVyV
Então, a função densidade será:
221
21)( zezf −=p , onde - )( ∞<<−∞ y < z < + )( ∞<<−∞ y
As probabilidades estão apresentadas na Tabela 1 do Anexo.A distribuição normal apresenta as seguintes propriedades:a) a função f(y) é simétrica em relação à origem y = Y ou a
função f(z) é simétrica em relação à origem z = 0;b) a função f(y) possui um ponto de máximo em y = Y com
ordenada igual a 0,3989/S(y) ou a função f(z) possui um ponto de máximo no ponto z = 0 com ordenada 3989,021 =p ;
c) a função f(y) tende a zero quando y tende para ± )( ∞<<−∞ y ou f(z) tende a zero quando z tende para ± )( ∞<<−∞ y ;
d) a função f(y) tem dois pontos de inflexão cujas abscissas
42
Amostragem em inventário florestal Waldenei Travassos de Queiroz
valem Y + S(y) e Y - S(y), e as ordenadas são iguais a 0,24/S(y). A função f(z) tem dois pontos de inflexão cujas abscissas valem + 1 e – 1, e as ordenadas valem 0,24.
Mood, Graybill e Boes (1964) apresentam informações mais detalhadas sobre a teoria e as aplicações acerca das di-versas funções de probabilidade.
exercício 3.3
Seja um viveiro com 1.000.000 de mudas de uma deter-minada espécie florestal e que um empresário florestal deseja adquirir plantas com alturas no intervalo de 15 cm altura 27 cm. Suponha a medição de uma amostra selecionada de forma inteiramente ao acaso de 1000 plantas. O resultado de um tes-te estatístico de aderência comprovou que a variável resposta altura (y) distribui-se normalmente com média Y = 20 cm e V(y) = 25 cm2. Calcular o número de plantas esperado que atenda o intervalo estipulado pelo empresário cliente.
00,15
2015
)(1 ��
�
�
�
�
yS
YyZ
i
4,15
2027
)(2 �
�
�
�
�
yS
YyZ
j
Consultando a Tabela 1 do anexo, tem-se:
�
�
�0
00,1
3413,0)( dzzf e � �40,1
0
4192,0)( dzzf
� � �� �
�����40,1
00,1
0
00,1
40,1
0
7605,04192,03413,0)()()( dzzfdzzfdzzf
43
Fundamentos de estatística
Conclui-se que a probabilidade de ocorrência de plantas no intervalo de 15 cm altura 27 cm é de 76,05 %. Então, o empresário florestal deve esperar, no intervalo estipulado, apro-ximadamente a disponibilidade de 760.500 plantas no viveiro.
3.5.7 distribuição de c2
A variável aleatória c2, denominada qui-quadrado com k graus de liberdade, é definida como a soma de k quadrados de normais padronizadas e independentes.
Então, ∑ ∑= =
−==
k
i
k
i
ii yS
Yyz
1 1
222 ])(
[c , para )1,0(Nz = .
A função densidade da variável c2 é dada pela Expressão 3.2. As probabilidades estão apresentadas na Tabela 2 do Ane-xo.
221
22)()1(2
2
2 )()2
1(
)(
1)(
ccc −−
Γ= ef
kk
k (3.2)
A função do tipo )2(kΓ é denominada de função gama e foi introduzida pelo matemático Leonardo Euler. Analiticamente é definida pela Fórmula:
∫∞
−=+Γ0
)1( dyeya ya dy
Demonstra-se que essa integral converge para 11 >+a . Informações teóricas e aplicações ver em Gomes e Nogueira (1980) e Piskounov (1978).
A distribuição c2 tem diversas e importantes aplicações, destacando-se entre elas as seguintes:
a) a distribuição c2 é utilizada como teste de aderência,
44
Amostragem em inventário florestal Waldenei Travassos de Queiroz
verificando se as distribuições empíricas, obtidas por meio dos dados amostrais, ajustam-se aproximadamente às distribuições teóricas;
b) outra aplicação importante é verificar a medida de dis-crepância entre as frequências observadas e as esperadas, ou seja, o objetivo é verificar se as frequências observadas diferem significativamente das esperadas. A estatística utilizada para ve-rificar essas hipóteses é:
;)(
1
2
2 ��
��
k
i i
ii
pfe
fefo�
c) verificar a hipótese )()()(: 210 yVyVyVH k=== L , que significa testar se existe igualdade de variâncias. De acordo com Steel e Torrie (1960), referida hipótese pode ser verificada pelo teste de Bartlett, por meio da estatística:
� �� �
����k
i
k
i
iiip yVnyVn1 1
1010
2 )}(ˆlog)1()](ˆlog)1({[3026,2�
)(ˆ yV = variância amostral
)(ˆ yV = variância amostral média (∑
∑
=
==k
ii
k
iii
n
yVnyV
1
1
)(ˆ
)(ˆ );
d) verificar a hipótese )()(: 00 yVyVH = que significa testar a igualdade da variância populacional quando comparada com um valor padrão )(0 yV .
De acordo com Fonseca e Martins (1982), essa hipótese pode ser testada através do teorema de Fisher:
)(
)(ˆ)1(
0
2
yV
yVnp
−=c
45
Fundamentos de estatística
Sendo n o tamanho da amostra; )(0 yV é o valor sob a hipó-tese nula; )(ˆ yV é a variância amostral;
e) obtenção do intervalo de confiança para a variância ver-dadeira de uma população normal. Se a variável y tem distri-buição normal com média Y e variância V(y), tem-se que, pelo teorema de Fisher, o intervalo de confiança para V(y) é:
acc
−=−
≤≤−
1))(ˆ)1(
)()(ˆ)1(
(2inf
2sup
yVnyV
yVnP .
O número de graus de liberdade a ser utilizado, neste caso, para obter o valor crítico é p = n-1.
Quando se utiliza a distribuição de 2pc para obter o número
de graus de liberdade (p), e assim ter os valores críticos para os diversos testes, considera-se as seguintes regras de decisão:
i) usar p = k-1, se as frequências esperadas no experimen-to são obtidas sem efetuar estimativas de parâmetros populacio-nais a partir de estatísticas amostrais;
ii) usar p=k-1-m, se as frequências esperadas são obtidas a partir da estimação de m parâmetros.
exercício 3.4
Um empresário do setor florestal está interessado em im-plantar em sua área uma indústria madeireira baseada no bene-ficiamento de apenas seis espécies. As informações disponíveis nos levantamentos realizados na região amazônica, pelas insti-tuições de pesquisa, indicam que as porcentagens de ocorrên-cias dessas espécies atendem às necessidades do projeto. O empresário, para obter as frequências observadas, efetuou na área um levantamento correspondente a 100.000 árvores. Con-siderando um nível de significância de a = 0,05, pergunta-se:
46
Amostragem em inventário florestal Waldenei Travassos de Queiroz
as frequências observadas divergem das esperadas? A Tabela 3.1 apresenta os dados sobre as frequências esperadas e as observadas.
tabela 3.1 - Frequências esperadas (fei) e frequências observadas (foi).
Espécies Porcentagem de ocorrência (Amazônia) (pi)
fei = pi x 100.000 (árvores) foi (árvores)
123456
2,52,01,81,51,10,8
25002000180015001100800
25361950179015801080820
800
)800820(
1100
)11001080(
1500
)15001580(
1800
)18001790(
2000
)20001950(
2500
)25002536( 22222225
−+
−+
−+
−+
−+
−=c
x52 = 6,95
Conclui-se pela não rejeição da hipótese da nulidade, visto que o valor calculado (x5
2 = 6,94) é menor que o valor tabelar (x5
2 = 11,1), obtido na Tabela 2 do Anexo para a = 0,05. Pode-se, então, afirmar que a ocorrência das espécies na área do empre-sário é semelhante à ocorrência na região amazônica.
3.5.8 distribuição “t” de student
Seja a variável aleatória:
n
ysYy
t)(
−=
Esta variável é conhecida como distribuição “t” de Student, com k = n-1 graus de liberdade, podendo também ser escrita na forma:
47
Fundamentos de estatística
1
)1,0(2
1
−
=−
n
Nt
nc
s (y) é o desvio padrão estimado.
O gráfico da função densidade da variável “t” de Student é simétrico e tem uma forma parecida com a da distribuição nor-mal, entretanto, menos achatada, com média zero e variância igual a )2( −kk , em que k > 2 (graus de liberdade). A função densidade da variável “t” é dada pela Expressão 3.3. As probabi-lidades estão apresentadas na Tabela 3 do Anexo.
2
12
1
2
21
)k(
)k
t(
k).k
(
)k
()t(f
+−
+pΓ
+Γ
= , onde - )( ∞<<−∞ y < t < )( ∞<<−∞ y (3.3)
A distribuição “t” de Student possui importantes aplicações, destacando-se entre elas as seguintes:
a) testa a hipótese 00 : YYH = . Verifica se há igualdade en-tre o valor médio de uma população versus um valor padrão, sendo essa hipótese testada através da estatística:
n
ysYy
t)(0−
= , que sob 0H apresenta n-1 graus de liberdade;
b) testa a hipótese 210 : YYH = . Verifica se há igualdade en-tre os valores médios de duas populações independentes, sen-do testada através da estatística:
)
11)((ˆ
21
21
nnyV
yyt
�
�
� , tal que: 2
)(ˆ)1()(ˆ)1()(ˆ
21
2211
−+−+−
=nn
yVnyVnyV
48
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Com 221 −+ nn graus de liberdade sob 0H , sendo )(ˆ yV a variância comum;
c) testa a hipótese 210 : YYH = . Verifica se há igualdade en-tre os valores médios de duas populações dependentes (teste “t” pareado), sendo testada por meio da estatística:
n
ysyy
td )(
21 −= , com n-1 graus de liberdade sob 0H .
Sendo: ,)(ˆ)( dVysd = tal que:
1
)(
)(ˆ
2
1
1
2
−
−=
∑∑ =
=
nn
dd
dV
n
iin
ii
, para iii yyd 21 −= .
Desde que a variável resposta seja normal, a distribuição “t” de Student é muito importante em termos de inventários flo-restais, pois permite obter os intervalos de confiança para os valores médio e total para os produtos florestais de uma popula-ção. É aplicada também para dimensionar o tamanho da amos-tra quando fixada à precisão. Informações mais detalhadas so-bre esses aspectos serão vistas quando da apresentação dos processos de amostragem nos capítulos seguintes.
exercício 3.5
Estudos científicos indicam que uma determinada espécie florestal com excelentes características tecnológicas, em uma determinada região tropical úmida em outro país, produz no fim de sua rotação, aos sete anos, um volume de madeira em tor-
49
Fundamentos de estatística
no de 100 m3/ha. Um empresário brasileiro tem interesse em introduzir a referida espécie para verificar se o comportamento é o mesmo em sua propriedade, e, para atingir seu objetivo, re-alizou um experimento com 20 unidades de amostra de 0,1 ha. A Tabela 3.2 apresenta os volumes medidos após sete anos da implantação do experimento.
tabela 3.2 - Volumes (m3) de madeira por unidade de 0,1 ha.
UA yi UA yi UA yi UA yi
12345
8,510,39,87,8
11,0
6789
10
9,610,98,99,8
11,5
1112131415
7,912 8,89,5
10,8
1617181820
8,88,7
12,37,78,9
A hipótese a ser formulada para atender o objetivo do em-presário é a seguinte: 00 : YYH = . A hipótese a ser testada é
hamYH /100: 30 = ha, e o teste deverá ser realizado por meio da
estatística:
n
ysYy
t)(0−
=
Sejam os valores estimados para a média e para a variância:
hamy 1,0/675,9 3�
hamy /75,96675,910 3���
9072,1)(ˆ�yV 3
/( 0,1ha)m
232)/(7237,1909072,110)(ˆ hamyV ���
hamys /8103,13)(3
�
2
50
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Então:
0524,10881,3
25,3
20
8103,13
10075,96��
�
�
�
�t
Dado que t19;0,05 = 2,0930, não há razão para rejeitar H0. Conclui-se, então, que o comportamento da espécie confirmou as informações oriundas das pesquisas, ou seja, o empresário pode esperar, com uma probabilidade de acerto de 95% que, se a espécie for plantada em sua propriedade, a mesma deverá pro-duzir em média um volume de 100 m3 de madeira por hectare.
3.5.9 distribuição “F” de snedecor
A estatística “F de Snedecor” é definida como a razão de duas variáveis independentes com distribuição 2c , ou seja:
p
kF
p
kpk 2
2
),( cc
=
O valor k é o número de graus de liberdade do numerador e p é o número de graus de liberdade do denominador. A função densidade da distribuição F de Snedecor é dada pela Equação 3.4. As probabilidades estão apresentadas nas Tabelas 4 e 5 do Anexo.
)(}
])(1[
{)(
)2
()2
(
]2/)[()( ),0(
)2
(
)2
2(
2 FI
Fp
k
F
p
k
pk
pkFf
pk
k
k
��
�
���
��� (3.4)
A distribuição F de Snedecor possui diversas aplicações no campo da estatística, entre elas destacam-se as seguintes:
a) testar a hipótese H0 : Ve (y) = 0 . Verificar se o componen-
51
Fundamentos de estatística
te de variância entre populações é igual a zero. Esta hipótese é muito utilizada na genética e, em termos de inventário florestal, pode ser utilizada para testar se o componente de variância en-tre os conglomerados é igual a zero. Este problema será visto com mais detalhes no capítulo sobre a Amostragem por Conglo-merados;
b) testar a hipótese H0 : t1 = t2 = • • • = tk = o . Verificar se os efeitos de k tratamentos são todos iguais a zero. O modelo ma-temático considera que os efeitos, devidos aos tratamentos, são fixos. A hipótese da nulidade H0 : t1 = t2 = • • • = tk = 0 é similar à hipótese kYYYH === L210 : ;
c) testar a hipótese H0 : V1(y) = V2(y). Verificar se há igual-dade entre duas variâncias, sendo testada através da estatística:
)(ˆ)(ˆ21 yVyVF =
Que sob H0 possui n1 - 1 graus de liberdade no numerador e n2 - 1 graus de liberdade no denominador.
É importante observar que a hipótese H0 : V1(y) = V2(y) = • • • = Vk(y) pode ser verificada pelo teste de Hartley ou teste da Razão Máxi-ma Hc . Ver a Tabela 6 do Anexo que, segundo Banzato e Kronka (1989), é específica para esse teste.
)(ˆ)(ˆ
min yV
yVH máx
c = , tal que:
)(ˆmax yV = maior variância
minV = menor variância
52
Amostragem em inventário florestal Waldenei Travassos de Queiroz
exercício 3.6
Seja um inventário florestal realizado através de uma amos-tra estratificada apresentando três estratos. A Tabela 3.3 mostra os dados de volumes de madeira de 39 parcelas de superfície de 0,25 ha, tendo a seguinte alocação por estrato: estrato 1 = 13 parcelas, estrato 2 = 15 parcelas e estrato 3 = 11 parcelas. Pede-se: testar a hipótese 3210 : YYYH == , que significa verificar se todas as médias são iguais. A Tabela 3.4 apresenta a análise de variância dos dados.
tabela 3.3 - Volumes (m3) por parcela de 0,25 ha.
ESTRATO I ESTRATO II ESTRATO III
21,1034,0018,0020,0055,0023,4240,5017,44
22,1225,0031,2017,0524,10
12,9017,009,50
20,0030,1023,4221,1017,44
22,1212,0016,5017,0524,1016,7121,80
8,1012,009,50
14,5018,1721,1010,807,50
6,5012,505,20
tabela 3.4 - Análise de variância para os três estratos.
Fontes de variação GL SQ QM F
Entre estratosDentro dos estratos
236
1421,96212069,6326
710,981157,4898
12,37**
Total 38 3491,5947
Sendo o valor de F calculado (12,37) maior que o valor tabelar (F2;36;0,01), conclui-se pela rejeição de 3210 : YYYH == , ou seja, existe pelo menos um contraste significativo entre as mé-dias. Caso haja necessidade em testar contrastes de interesse entre os valores médios dos estratos, é recomendável aplicar testes de comparações múltiplas.
cApítulo 4
AmostrAgem sImples Ao AcAso
Do ponto de vista estatístico define população e, para fins de aplicação em inventários florestais, caracteriza as finitas e as infinitas. Caracteriza os objetivos quando da realização de um levantamento por amostragem. Descreve os parâmetros popula-cionais e os seus estimadores. Mostra a teoria para obtenção de intervalos de confiança e dimensionamento da amostra simples ao acaso. Aborda a amostragem simples ao acaso para propor-ções e porcentagens. Contempla com exemplos todos os temas citados.
55
Amostragem simples ao acaso
Do ponto de vista estatístico, uma população é o conjunto de todos os indivíduos, elementos ou unidades sobre os quais se deseja desenvolver estudos, visando conhecer determinadas características. Quando somente uma parte dos elementos ou unidades é selecionada para o procedimento das análises, tem-se o que se denomina de amostra.
Existem populações finitas e infinitas. Para fins de amostra-gem, determinadas populações finitas podem ser consideradas como infinitas, desde que o tamanho da amostra corresponda a, no máximo, 5 % das unidades da população.
O método da amostra simples ao acaso ou amostra inteira-mente casualizada é o mais tradicional procedimento de amos-tragem.
A amostra simples ao acaso baseia-se num processo estri-tamente aleatório, na qual as unidades amostrais são seleciona-das com igual probabilidade (1/N), em que N é o número total de unidades que compõem o espaço amostral, ou seja, a população amostrada. Na amostra simples ao acaso sem reposição, as unida-des são selecionadas independentemente entre si, e o número de amostras possíveis (nap) de tamanho igual a n é dado pela relação:
)!(!!nNn
N
n
NCnap
���
Não obstante, apenas uma das possíveis combinações é
selecionada para a amostragem, de tal forma que as unidades que comporão a amostra são sorteadas independentemente en-tre si.
Scolforo (1993) cita que, como nem sempre é possível fa-zer uma enumeração completa de todos os indivíduos de uma população florestal, os levantamentos são realizados tendo como base a teoria estatística da amostragem, que é definida
56
Amostragem em inventário florestal Waldenei Travassos de Queiroz
como a observação de uma amostra da população para obter estimativas representativas para o todo, sendo constituída de indivíduos que apresentam características comuns que repre-sentem a população a qual pertencem. A amostra é formada por um grupo de unidades amostrais.
No que concerne ao inventário florestal, a amostra simples ao acaso é geralmente conduzida a partir de um sorteio sem reposição, assumindo-se, evidentemente, o pressuposto da per-manência de igual probabilidade para as unidades remanescen-tes em cada sorteio, respaldando-se no fato de que, geralmente, as populações florestais são consideradas estatisticamente infi-nitas, assim como a inclusão de uma unidade amostral mais de uma vez na amostra refletirá uma homogeneização da variância entre as unidades da amostra.
A amostra simples ao acaso, que é um processo congruen-te, ou seja, quando n = N, as estimativas coincidem com os valo-res populacionais, é recomendada para pequenas áreas flores-tais não superiores a 10.000 ha, com características homogêne-as com respeito às variáveis de interesse e com fácil estrutura de acessibilidade.
Quando da realização de um levantamento por amostra-gem, geralmente, têm-se os seguintes objetivos:
a) estimar o valor médio para a variável resposta;b) estimar o valor total para a variável resposta;c) estimar a porcentagem ou a proporção sobre a ocorrên-
cia de um certo atributo;d) estimar a variância da variável resposta;e) obter os intervalos de confiança do valor médio e do va-
lor total para a variável resposta.
57
Amostragem simples ao acaso
4.1 VALORES POPULACIONAIS E ESTIMADORES
Para formular os valores populacionais e estimadores, será usada a seguinte notação:
N = número total de unidades em que a população foi divi-dida, função direta do tamanho da unidade de amostra;
n = número de unidades de amostra;yi = valor observado da variável resposta concernente à i-
ésima unidade de amostra.
a) valor médioa1) valor médio populacional
N
yY
N
ii∑
== 1 a2) valor médio estimado
n
yy
n
ii∑
== 1
Este estimador é não tendencioso (“unbiased”), pois, tem-se:
Yn
yEyE
n
ii
==∑
= )()( 1
b) valor total b1) valor total populacional
YNY = b2) valor total estimado
yNY =ˆ
58
Amostragem em inventário florestal Waldenei Travassos de Queiroz
c) variânciac1) variância populacional
1
)(
1
)()(
2
1
1
2
1
2
−
−=
−
−=
∑∑∑ =
==
NN
yy
N
YyyV
N
iiN
ii
N
ii
c2) variância estimada
1
)(
1
)()(ˆ
2
1
1
2
1
2
−
−=
−
−=
∑∑∑ =
==
nn
yy
n
yyyV
n
iin
ii
n
ii
d) desvio padrãod1) desvio padrão populacional
)()( yVyS =
d2) desvio padrão estimado
)(ˆ)( yVys = e) variância da médiae1) variância da média populacional
)()(
)(N
nN
n
yVyV
−=
e2) variância da média estimada
)()(ˆ
)(ˆN
nN
n
yVyV
−=
59
Amostragem simples ao acaso
O valor NnN )( − é denominado fator de correção para população finita. Quando a população for definida como infinita, ou seja, n < 0,05N, não há necessidade de aplicá-lo.
f) erro padrãof1) erro padrão populacional
)()( yVyS =
f2) erro padrão estimado)(ˆ)( yVys =
g) coeficiente de variação
O coeficiente de variação permite interpretar mais facil-mente a variabilidade das observações, viabilizando uma com-paração relativa entre o desvio padrão e a média.
g1) coeficiente de variação populacional
100)(
% ×=Y
ySCV
g2) coeficiente de variação estimado
100)(
%ˆ ×=y
ysVC
h) intervalo de confiança
A estimação consiste em processar os resultados extraídos por amostragem e fazer inferências sobre a população da qual foi extraída aleatoriamente a amostra. Pode-se fazer a estima-ção de parâmetros de duas formas:
100)(
%ˆ ×=y
ysVC
60
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Estimação por ponto: quando a partir da amostra obtém-se um único valor para estimar um determinado parâmetro popula-cional;
Estimação por intervalo: quando a partir da amostra calcu-la-se um intervalo da forma 21 θθθ ≤≤ , admitindo certa proba-bilidade 1 - a (nível de confiança) de que o intervalo contenha o verdadeiro valor do parâmetro populacional θ . Dessa maneira, a será o nível de significância, isto é, o erro que se comete ao afirmar que, por exemplo, 95 % das vezes o intervalo 21 θθθ ≤≤ contém θ será de 5%.
h1) cálculo do intervalo de confiança para a média popula-cional (Y ) se conhecida a variância populacional :)(yV
Seja y uma variável aleatória distribuída normalmente com média Y e variância )(yV , ou seja, y ~ N[Y , )(yV ]. Então, a mé-dia amostral y também terá distribuição normal com média Y e variância V( y ) = V(y)/n, ou seja, y ~ N[Y ,V (y)/n].
Seja a variável padronizada
y
ySYy
z)(
−= .
A variável z é denominada normal reduzida com média
zero e variância igual a 1. A Figura 4.1 mostra a forma gráfica dessa distribuição padrão z e, na Tabela 1 do Anexo, as proba-bilidades.
61
Amostragem simples ao acaso
Figura 4.1 - Forma gráfica da distribuição normal reduzida.
Da construção gráfica ilustrativa da distribuição normal, pode-se escrever que:
aaa −=≤≤− 1)(22
ZZZP
aaa −=≤−
≤− 1))(
(22
Z
n
ySYy
ZP
Portanto:
aaa −=+≤≤− 1)/)(/)((22
nySzyYnySzyP
h2) cálculo do intervalo de confiança para média populacio-nal (Y ) se desconhecida a variância populacional V(y).
No caso do desconhecimento da variância populacional, de-ve-se calcular a estimativa do desvio padrão através da amostra.
Seja o gráfico da função densidade da variável “t” de Stu-dent, que é simétrico e tem uma forma parecida com a da dis-tribuição normal (Figura 4.2), entretanto, menos achatada, com média zero e variância igual a )2( −kk , em que k > 2 (graus de liberdade).
62
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Figura 4.2 - Forma gráfica da distribuição “t” de Student.
Da construção gráfica ilustrativa da distribuição “t” de Stu-dent, tem-se:
a−=≤≤− aa 122)ttt(P , resultando:
aaa −=+≤≤− 1))()(
(22 n
ystyY
n
ystyP
A estrutura matemática para o cálculo do intervalo de con-
fiança pode ser apresentada de uma forma mais simples:
IC )(ystyIC ×±=
Assim, tem-se: IC
n
ys
N
nNtyIC
)()( ×
−±= , para populações finitas;
IC n
ystyIC
)(±= , para populações infinitas;
IC )(( ystyNIC ×±= , para o valor total.
63
Amostragem simples ao acaso
i) dimensionamento da amostra simples ao acaso.
Dados, respectivamente, os estimadores da variância da média e do intervalo de confiança como anteriormente definidos:
)()(ˆ
)(ˆN
nN
n
yVyV
−= e IC )(ystyIC ×±=
Seja E = t yLEE ×= s )(ystE ×= a semiamplitude do intervalo de confian-ça, conhecida no jargão da engenharia florestal brasileira como expectância do erro, valor normalmente fixado de acordo com o grau de precisão desejado. Essa semiamplitude pode ser fixada como um valor percentual da média, ou seja, E = LE yLEE ×= . Neste caso, LE é denominado limite de erro.
A fórmula para conseguir o número de unidades de amos-tra (n), atendendo um limite de erro predefinido, é obtida da se-guinte forma:
)(ystE ×=)(
)(ˆ)(ˆ 222
N
nN
n
yVtyVtE
−==
)1()(ˆ
22
N
n
n
yVtE −=
N
yVt
n
yVtE
)(ˆ)(ˆ222 −=
Resultando para o caso de populações finitas:
N
yVtE
yVtn
)(ˆ)(ˆ
22
2
+=
No caso de populações infinitas, tem-se:
n
yVtE
)(ˆ= , resultando:
64
Amostragem em inventário florestal Waldenei Travassos de Queiroz
2
2 )(ˆ
E
yVtn =
Por outro lado, é factível ocorrer que os recursos financeiros disponíveis sejam um fator limitante. Neste caso, Husch, Miller e Beers (1972) recomendam que a intensidade de amostragem seja estabelecida através da seguinte equação linear de custo:
c = c0 + nc1
c = custo total do inventário (medição de campo);c0 = custos fixos (planejamento e trabalhos de escritório);c1 = custo médio por unidade de amostra;n = número de unidades de amostra.
O componente nc1 corresponde ao custo total da coleta de dados de campo.
exercício 4.1
Seja uma área florestal de 3.574 ha, localizada na região de Marajó, onde, a partir de uma amostra simples ao acaso, fo-ram enumeradas 27 unidades. A unidade amostral de 2.500 m2 apresentou uma forma retangular de 10 m de largura e 250 m de comprimento, onde foram mensuradas todas as árvores com DAP 45 cm, enquanto que para as árvores com 15 cm DAP < 45 cm foi estabelecida uma subamostra de 1.000 m2, compreen-dendo 10 m de largura por 100 m de comprimento. A Tabela 4.1 apresenta os resultados dos volumes para as árvores contidas em 15 cm DAP < 45 cm; e a Tabela 4.2, os volumes para as árvores com DAP 45 cm. O cálculo do volume por árvore foi
65
Amostragem simples ao acaso
obtido através da equação de volume VSC HDAPVSC25179,00775,0ˆ += ,
desenvolvida por Queiroz (1984), sendo:VSC = volume sem casca por árvore;DAP = diâmetro a altura do peito com casca;H = altura comercial.Efetuar a análise considerando os seguintes casos:1) Análise estatística da variável volume no intervalo 15 cm
DAP < 45 cm.2) Análise estatística da variável volume para DAP 45 cm.
tabela 4.1 - Volume (m3/0,1 ha) para 15 cm DAP < 45 cm.
UA Yi UA Yi UA Yi UA Yi UA Yi
1 6,45 7 9,289 13 6,208 19 11,700 25 9,642
2 17,00 8 9,915 14 14,21 20 10,080 26 7,549
3 4,31 9 10,540 15 6,356 21 8,765 27 2,937
4 7,53 10 6,597 16 9,975 22 5,508
5 7,21 11 7,193 17 9,953 23 4,292
6 4,19 12 13,92 18 9,731 24 7,173
tabela 4.2 - Volume (m3/0,25 ha) para DAP 45 cm.
UA Yi UA Yi UA Yi UA Yi UA Yi
1 12,9914 7 21,9215 13 17,5972 19 14,5159 25 18,3705
2 16,1036 8 17,4466 14 24,0426 20 29,7010 26 25,3622
3 9,6805 9 22,1176 15 16,7197 21 30,4842 27 18,5761
4 20,0752 10 12,8449 16 21,8991 22 14,6925
5 29,6375 11 16,5398 17 10,4113 23 18,9567
6 23,4207 12 17,0837 18 10,0260 24 19,6981
66
Amostragem em inventário florestal Waldenei Travassos de Queiroz
1) Análise estatística da variável volume no intervalo 15 cm dAp < 45 cm
a) valor médio estimado
y = 84,41m3/ ha b) valor total estimado
yNY ×=ˆ = 35.740 × 8,4406667 = 301.669,43 m3, para:
N = Área/T.U.A = 3574 ha/0,1 ha = 35.740
T.U.A = Tamanho da Unidade de Amostra
c) variância estimada
d) desvio Padrão estimado
23
21
2
1
2
)1,0/(6883,1026
27
8980,2275079,2201
1
)(
)(ˆ hamn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
��
�
�
232 )/(8342,10686883,1010)(ˆ hamyV ���
hamn
y
y
n
i
i
1,0/4407,827
898,227 31���
��
hamhayVys /6930,32/)(ˆ)(3��
67
Amostragem simples ao acaso
e) variância da média estimada
f) erro padrão estimado
hamhayVys /29,6/)(ˆ)( 3��
g) coeficiente de variação estimado
%73,38100406667,84
69303,32100
)(%ˆ
�����
y
ysVC
h) intervalo de confiança (IC)
Na Tabela 3 do Anexo, tem-se o valor tabelar para a= 0,05 e n - 1 = 26:
0555,21,
2
=−n
ta Limite inferior para o valor médio
)(ysty ×− =84,406667-2,0555x6,289399= 71,48 m3/ ha
Limite superior para o valor médio)(ysty ×+ = 84,406667 + 2,0555 x 6,2893995 = 97,33 m3/ ha
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio real para o volume das árvores com 15 cm DAP < 45 cm encontra-se no intervalo de 71,48 m3/ ha a 97,33 m3/ ha.
Limite inferior para o valor totalárea )([ ysty ×− ]=3574 x 71,478806 =225.465,25 m3
Limite superior para o valor totalárea )]([ ysty �� = 3574×97,334528= 347.873,60 m3
23)/(5565,39)
35740
2735740(
27
8342,1068)(
/)(ˆ)(ˆ ham
N
nN
n
hayVyV �
�
�
�
�
68
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o volume total real para a população florestal de 3.574 ha encontra-se no intervalo de 225.465,25 m3 a 347.873,60 m3.
i) limite de erro
)(ystE ×= = 2,0555 × 6,2893995 = 12,927861 m3/ha
j) dimensionamento da amostra
Considerando que o limite de erro requerido para o inven-tário florestal seja de LE = 0,1 (10 %). O resultado do limite de erro obtido para a variável resposta volume (15 cm DAP 45 cm) foi de 15,32 % para 27 unidades de amostra. Então, deve-se calcular o número de unidades de amostra, visando atender ao limite de erro desejado de LE = 0,1 e, finalmente, calcular o número de unidades faltantes.
n = 64 unidades de amostra
Para:
E = LE yLEE ×= = 0,10 x 84,406667 = 8,4406667 m3/ha
Concluindo que se deve voltar ao campo e medir mais 37 unidades de amostra para atender ao limite de erro fixado em LE = 0,1.
27,63
35740
8342,10680555,24406667,8
8342,10680555,2
)(ˆ
)(ˆ
22
2
22
2
�
��
��
�
�
N
yVtE
yVtn
%32,15100406667,84
927861,12100% �����
y
ELE
69
Amostragem simples ao acaso
2) Análise estatística da variável volume para dAp 45 cm
a) valor médio estimado
hamn
y
y
n
i
i
25,0/9228,1827
9161,501 31 ���
�� , onde: = 75,69 m3/ha
b) valor total estimado
yNY ×=ˆ = 14296 x 18,922819 = 270.520,61 m3, onde:
N = Área/T.U.A. = 3574 ha/0,25 ha = 14.296
c) variância estimada
d) desvio padrão estimado
e) variância da média estimada
f) erro padrão estimado
m3/ ha
y
23
21
2
1
2
)25,0/(8930,3226
27
9161,510191,10523
1
)(
)(ˆ hamn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
��
�
�
232 )/(2885,52689303,324)(ˆ hamyV ���
)/(94,222885,526/)(ˆ)( 3 hamhayVys ���
23 )/(4553,19)14296
2714296(
27
28847,526)(
/)(ˆ)(ˆ ham
N
nN
n
hayVyV �
�
�
�
�
41.44553,19/)(ˆ)( ��� hayVys
70
Amostragem em inventário florestal Waldenei Travassos de Queiroz
g) coeficiente de variação estimado
h) intervalo de confiança (IC) Limite inferior para o valor médio
)(ysty ×− =75,691276-2,0555 x 4,4108221= 66,62 m3/ ha
Limite superior para o valor médio)(ysty ×+ = 75,691276 + 2,0555 x 4,4108221= 84,76 m3/ ha
Há razão para afirmar, com uma probabilidade de acerto de
95%, que o valor médio real da floresta para o volume das árvo-res com DAP 45 cm encontra-se no intervalo de 66,62 m3/ ha a 84,76 m3/ ha.
Limite inferior para o valor total área[ )(ysty ×− ] = 3574 x 66,624831= 238.117,15 m3
Limite superior para o valor totalárea[ )(ysty ×+ ] = 3574 x 84,757721= 302.924,09 m3
Dado 0555,2
1,2
=−n
ta para a = 0,05 e n - 1 = 26.
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional real da floresta para o volume das árvores considerando DAP 45 cm encontra-se no intervalo de 238.117,15 m3 a 302.924,09 m3.
%31,3010069,75
94,22100
)(%ˆ
�����
y
ysVC
71
Amostragem simples ao acaso
i) limite de erro
=×= )(ystE 2,0555 x 4,4108221 = 9,0664448 m3/ ha
j) dimensionamento da amostra
Supondo-se que o limite de erro requerido para o inventário florestal seja de LE = 0,1 (10 %). O resultado do limite de erro obtido para a variável resposta volume com DAP 45 cm foi de 11,98 % para 27 unidades de amostra. Então, deve-se calcular o número de unidades de amostra, visando atender ao limite de erro desejado de LE = 0,1 e, finalmente, calcular o número de unidades faltantes.
n = 39 unidades de amostra=×= )(ystE 0,1 x 75,691276 = 7,5691276 m3
Conclui-se que se deve voltar ao campo e medir mais 12 unidades de amostra, para totalizar 39 unidades e assim atender ao limite de erro fixado de LE = 0,10, visto que foram medidas apenas 27 unidades.
4.2 AMOSTRAGEM SIMPLES AO ACASO PARA PROPOR-çõES E PORCENTAGENS
Em inventários florestais, frequentemente, deseja-se esti-mar o número total, a proporção ou a porcentagem de unida-
71,38
14296
2885,5260555,25691276,7
2885,5260555,2
)(ˆ
)(ˆ
22
2
22
2
�
��
��
�
�
N
yVtE
yVtn
71,38
14296
2885,5260555,25691276,7
2885,5260555,2
)(ˆ
)(ˆ
22
2
22
2
�
��
��
�
�
N
yVtE
yVtn
72
Amostragem em inventário florestal Waldenei Travassos de Queiroz
des da população que apresenta certa característica ou atributo. Alguns resultados como número de árvores mortas, a porcen-tagem de ocorrência de uma determinada espécie, número de árvores que estão produzindo sementes são informações muitas vezes requeridas em alguns inventários.
A classificação do atributo, na maioria dos levantamen-tos, pode ser incluída na ficha de campo sob forma de pergunta construída para ser respondida com um simples “sim” ou “não”.
Seja uma população com N unidades, tal que qualquer uni-dade pertença a uma das duas categorias C1 e C0, sendo que C1 corresponde às unidades que possuem o atributo desejado e C0 define as unidades que não o possuem. Então, pode-se definir:
A = número de unidades da população que pertence à ca-tegoria C1;
a = número de unidades da amostra classificado na cate-goria C1;
N = tamanho da população;n = tamanho da amostra;
NAP /= é a proporção de unidades da categoria C1 na população;
nap /= é a proporção de unidades da categoria C1 na amostra.
Tem-se que p é uma estimativa de P e Np é uma estimativa de A.
Em inventários florestais, a distribuição binomial é a mais usada para obter as estimativas de a e p, pois, frequentemente, as populações são infinitas. Para populações finitas, a distribui-ção binomial constitui uma boa aproximação, embora a distribui-ção correta, neste caso, seja a hipergeométrica.
73
Amostragem simples ao acaso
4.2.1 valores populacionais, estimadores e dimensiona-mento da amostra
Para quantificar os resultados, seja a seguinte regra para qualquer unidade iy da amostra ou da população:
1=iy , se iy estiver contido em C1;0=iy , se iy estiver contido em C0;
Para a população de valores iy , resulta que:
∑=
==N
ii AyY
1
Para a amostra de valores iy , tem-se:
∑=
=n
ii ay
1
Dado que yNY =ˆ , então .ˆ Npn
aNY =×=
Np
A estimação de A e P consiste em obter os valores médio e total de uma população, onde todos os iy têm valor 1 ou 0. Então:
PN
A
N
yY
N
ii
===∑
=1
pn
a
n
yy
n
ii
===∑
=1
74
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Por conseguinte:
Para: PQ −= 1
Destarte:
11
)()(ˆ 1
2
−=
−
−=∑
=
n
npq
n
yyyV
n
ii
Então:
Por conseguinte:
Para o valor total populacional e seu estimador:
)()()ˆ( 2 pVNNpVYV == V (Np) = N2V(p)
)(ˆ)(ˆ)ˆ(ˆ 2 pVNNpVYV ==
��
��N
i
i NpAy1
2
��
��n
i
i npay1
2
11
)1(
111
)(
)(2
2
1
2
1
2
��
�
��
�
��
�
�
��
�
�
����
N
NPQ
N
PNP
N
NPNP
N
YNy
N
Yy
yV
N
i
i
N
i
i
n
PQ
N
nN
N
NPQ
Nn
nN
n
yV
N
nNpVyV )
1(
1)(
)()()()(
�
�
�
�
�
�
�
��
pqnN
nN
n
npq
Nn
nN
n
yV
N
nNpVyV
)1(
)(
1)(
)(ˆ)()(ˆ)(ˆ
�
�
�
�
�
�
�
��
Np
75
Amostragem simples ao acaso
Para obter o intervalo de confiança para P, considera-se que os dados seguem uma distribuição aproximadamente nor-mal, resultando:
, onde Nnf /= e o termo
n2/1 é uma correção de continuidade.
Para o valor total Y , virá:
O dimensionamento da amostra é o mesmo discutido ante-riormente, onde conhecendo: ,t )(ˆ yV e E , têm-se:
1)(ˆ
−=
n
npqyV
E = LE yLEE ×=
pn
a
n
yy
n
ii
===∑
=1 .
Dado que:
)(ystE ×= e n
yV
N
nNpVyV
)()()(ˆ)(ˆ −
== .
Então:
1)(
1
1)()(ˆ)(ˆ
−−
=−
×−
==n
pq
N
nN
n
npq
nN
nNpVyV
Portanto:
]2
1)1/(1[
nnpqftpIC �����
]2
1)1/(1[ˆ
nnpqftNYIC �����
pq
76
Amostragem em inventário florestal Waldenei Travassos de Queiroz
exercício 4.2
Seja uma pesquisa sobre a ocorrência de uma determinada doença em um povoamento florestal com 100.000 árvores, onde foi tomada uma amostra simples ao acaso de 800. Verificou-se que 90 plantas da amostra apresentaram os sintomas da doença. Estimar a proporção e o número total de plantas doentes do povoamento.
Dado que:000.100�N ; ;800�n ;90�a . Tem-se:
;008,0000.100
800��f ;1125,0800/90/ ��� nap
.8875,01125,011 ����� pq
8875,01125,0799000.100
)800000.100(
)1(
)()(ˆ)(ˆ
��
�
�
�
�
�
�� pqnN
nNpVyV
0150001239612,0)1(
)()(ˆ)(ˆ
�
�
�
�� pqnN
nNpVyV
011133786,0)(ˆ)( �� pVps
Têm-se:
)1(11)1(
1)(
22
222
�
�
�
�
�
��
�
�
�
nN
npqt
n
pqt
n
pq
N
nt
n
pq
N
nNtE
N
npqtpqtEn
222)1( ���
N
npqtpqtEnE 2222
���
pqtEN
npqtnE
2222���
N
pqtE
Epqtn
2
2
22
�
�
�
000.100�N ; ;800�n ;90�a . Tem-se:
;008,0000.100
800��f ;1125,0800/90/ ��� nap
.8875,01125,011 ����� pq
8875,01125,0799000.100
)800000.100(
)1(
)()(ˆ)(ˆ
��
�
�
�
�
�
�� pqnN
nNpVyV
0150001239612,0)1(
)()(ˆ)(ˆ
�
�
�
�� pqnN
nNpVyV
011133786,0)(ˆ)( �� pVps
77
Amostragem simples ao acaso
Resultando o seguinte intervalo de confiança para P usan-do t = 2,0 ( 05,0=a 0,05):
Conclui-se que, com 95% de probabilidade de acerto, a proporção de plantas doentes situa-se no intervalo de 0,0889 a 0,1354.
Dado que yNY =ˆ ou
Então, o intervalo de confiança para o total, será:
Conclui-se que, com 95% de probabilidade de acerto, o número esperado de plantas doentes situa-se no intervalo de 8.890 a 13.540, que corresponde a um limite de erro de 19,79%.
]2
1)1/(1[
nnpqftpIC �����
]8002
1799/8875,01125,0008,010,2[1125,0
������IC
022892752,01125,0]8002
101117859,09960,00,2[1125,0 ��
������IC
1354,00896,0 �� P
.250.111125,0000.100ˆ����� Np
n
aNY
78
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Supondo que o limite de erro requerido para o levanta-mento seja de LE = 0,1 (10 %). O resultado do limite de erro obtido para a variável resposta (ocorrência da doença) foi de 19,79 para 800 unidades de amostra. Então, deve-se calcular o número de unidades de amostra, visando atender ao limite de erro desejado de LE = 0,10 e, finalmente, calcular o número de unidades faltantes.
Dado:
pn
a
n
yy
n
ii
===∑
=1
09996871,0799
8875,01125,0800
1)(ˆ =
××=
−=
n
npqyV
Então:
Conclui-se que é necessário retornar ao campo e medir mais 2.260 plantas, para totalizar 3.060 unidades e assim aten-der ao limite de erro fixado de LE = 0,10, visto que foram medi-das apenas 800 unidades.
060.3
000.100
8875,01125,02)1125,010,0(
)1125,010,0(8875,01125,022
2
22
22
22
�
��
��
�����
�
��
N
pqtE
Epqtn
cApítulo 5
AmostrAgem estrAtIFIcAdA
Define a amostragem estratificada e apresenta recomen-dações de quando aplicá-la em inventário florestal. Descreve os critérios para se proceder à estratificação. Descreve os pa-râmetros populacionais e os seus estimadores. Mostra a teoria para obtenção de intervalos de confiança e dimensionamento da amostra, assim como compara a precisão desta em relação à amostra simples ao acaso. Descreve um estudo de caso para inventário florestal de áreas extensas apresentando subpopula-ções com diferentes intensidades de amostragem, o que poderá ocorrer no Inventário Florestal Nacional (IFN) do Brasil quando da realização do levantamento na Amazônia. Mostra exemplos sobre todos os temas citados.
81
Amostragem estratificada
A amostragem estratificada consiste em dividir uma po-pulação de tamanho N em L subpopulações constituídas de
LNNN ,,, 21 L unidades, tal que não haja superposição e, juntas, totalizem a população de tamanho N, ou seja:
∑=
=L
hhNN
1
, tal que .,,1 Lh L=
As subpopulações, denominadas estratos, devem ter os valores Nh conhecidos, pois dentro de cada estrato, separada-mente, seleciona-se uma amostra de tamanho nh. A grandeza amostral para a população será igual a .21 Lnnnn +++= L
Em inventários florestais, a amostragem estratificada é re-comendável para o estudo de populações florestais que apre-sentem heterogeneidade entre as subpopulações com referên-cia à variável de interesse. Nesse caso, a estratificação pode propiciar um aumento no grau de precisão do inventário, pois, torna possível subdividir uma população heterogênea em estra-tos que, individualmente, sejam homogêneos, resultando ganho em eficiência e diminuição dos custos.
A determinação dos estratos é feita em função das carac-terísticas peculiares da população florestal, onde, em muitos ca-sos, os estratos já estão fisicamente definidos, como no caso de povoamentos florestais plantados com talhões de diferentes idades. Por outro lado, existem casos em que a delimitação dos estratos (tipos florestais) só é possível através de levantamentos aerofotogramétricos. O processo para obter os estratos denomi-na-se estratificação e a amostra é dita estratificada.
Denomina-se amostra acidental estratificada quando são selecionadas amostras inteiramente ao acaso nos estratos.
De acordo com Cochran (1965), há diversos critérios para se proceder à estratificação. Os principais são os seguintes:
82
Amostragem em inventário florestal Waldenei Travassos de Queiroz
a) a estratificação ideal é aquela realizada segundo a magni-tude do valor da variável de interesse, obtendo-se ganho de preci-são quando houver variação sensível entre os estratos definidos;
b) a estratificação de conformidade com a variação da ve-getação pode ser de interesse para o inventário florestal; entre-tanto, não é assegurado, com relação às variáveis respostas, existir variabilidade entre os estratos. Por outro lado, se houver correlação entre o tipo de vegetação e os valores das variáveis respostas, então a estratificação com base na florística resultará na estratificação das variáveis respostas; nesse caso, há ganho de precisão;
c) razões administrativas podem direcionar para a utiliza-ção da estratificação, visando principalmente caracterizar pecu-liaridades locais ou regionais.
Existem casos em que, por falta de informações prelimina-res ou mesmo ausência de instrumentos que possam viabilizar a estratificação da floresta, pode-se, depois de tomada a amostra, proceder a uma pós-estratificação com respeito às variáveis res-postas mensuradas.
Inventários florestais delineados a atender a planificação de técnicas de manejo de florestas naturais, obrigatoriamente, devem abranger e explicar as principais variáveis que compõem a estrutura do povoamento. Nesse caso, verifica-se que são re-queridas diversas variáveis, as quais estão inter-relacionadas, e, para tornar possível caracterizar a estrutura desses tipos flores-tais, é necessário analisá-las estatisticamente através de técni-cas de análise multivariada. Para proceder à análise estatística dessas informações multidimensionais, Queiroz (1984) apresen-ta uma metodologia de pós-estratificação multidimensional fun-damentada na análise de fatores, através do método da máxima verossimilhança, para um conjunto de variáveis respostas, vi-
83
Amostragem estratificada
sando obter mapas tipológicos para um povoamento florestal lo-calizado na região do planalto da Floresta Nacional do Tapajós.
5.1 VALORES POPULACIONAIS E ESTIMADORES POR ES-TRATO
Para formular os valores populacionais e estimadores, será usada a seguinte notação:
N = número total de unidades em que a população foi di-vidida;
hN = número de unidades em que o h-ésimo estrato foi dividido;
n = número de unidades de amostra a serem medidas considerando todos os estratos;
hn = número de unidades de amostra a serem medidas no h-ésimo estrato;
yhi = valor observado da variável resposta referente à i-ésima unidade de amostra no h-ésimo estrato;
N
NW h
h = = peso do h-ésimo estrato;
h
h
N
n = fator de amostragem no h-ésimo estrato;
h
h
n
N = fator de expansão no h-ésimo estrato;
L= número de estratos.A formulação da análise estatística a ser apresentada refe-
re-se à aplicação em cada estrato da amostra simples ao acaso.
a) valor médio por estrato
84
Amostragem em inventário florestal Waldenei Travassos de Queiroz
a1) valor médio populacional por estrato
h
N
i
hi
hN
y
Y
h
��� 1
a2) estimador do valor médio por estrato
h
n
i
hi
hn
y
y
h
��� 1
b) valor total por estratob1) valor total populacional por estrato
hhh YNY =
b2) estimador do valor total por estrato
hhh yNY =ˆ
c) variância por estratoc1) variância populacional por estrato
1
)(
1
)(
)(
1
2
1
22
1
�
�
��
�
�
���
�
��
h
h
N
i
hiN
i
hi
h
N
i
hhi
hN
N
y
y
N
Yy
yV
h
hh
c2) estimador da variância por estrato
1
)(
1
)(
)(ˆ
1
2
1
22
1
�
�
��
�
�
���
�
��
h
h
n
i
hin
i
hi
h
n
i
hhi
n
n
y
y
n
yy
yV
h
hh
85
Amostragem estratificada
d) desvio padrão por estratod1) desvio padrão populacional por estrato
)()( yVyS hh =
d2) estimador do desvio padrão por estrato
)(ˆ)( yVys hh =
e) variância da média por estratoe1) variância da média populacional por estrato
)()(
)(h
hh
h
hh N
nN
n
yVyV
−=
e2) estimador da variância da média por estrato
)()(ˆ
)(ˆh
hh
h N
nN
n
yVyV
−=
Em relação à aplicação da amostragem, uma população pode ser classificada como finita ou infinita. Determinadas po-pulações finitas podem ser consideradas infinitas desde que o tamanho da amostra seja no máximo 5% da área, ou seja:
1) Se ,95,0)( ≥−hNhh nN ,95,0)( ≥−
hNhh nN ,95,0)( ≥−hNhh nN 0,95, a população é denominada in-
finita;2) Para ,95,0)( <−
hNhh nN ,95,0)( ≥−hNhh nN <0,95, a população é definida como
finita. O termo
hNhh nN )( − ,95,0)( ≥−hNhh nN é denominado correção para popu-
lação finita.
86
Amostragem em inventário florestal Waldenei Travassos de Queiroz
f) erro padrão por estratof1) erro padrão populacional por estrato
)()( hh yVyS =
f2) estimador do erro padrão por estrato
)(ˆ)( hh yVys =
g) coeficiente de variação por estratog1) coeficiente de variação populacional por estrato
100)(
% ��
h
h
hY
ySCV
g2) estimador do coeficiente de variação por estrato
100)(
%ˆ ×=h
hh y
ysVC
h) intervalo de confiança por estratoh1) intervalo de confiança para a média populacional por es-
trato ( hY ), se conhecida a variância populacional por estrato Vh(y).
aaa −=+≤≤− 1))()(
( 2/2/
h
hhh
h
hh
n
ySZyY
n
ySZyP
h2) intervalo de confiança para a média populacional por estrato (
hY ), se desconhecida a variância populacional por es-trato Vh(y).
aaa −=+≤≤− 1))()(
( 2/2/
h
hhh
h
hh
n
ystyY
n
ystyP
Ou, simplesmente,
IC )( hh ystyIC ×±=
87
Amostragem estratificada
IC
h
h
h
hhh
n
ys
N
nNtyIC
)(×
−±= (populações finitas)
IC h
hh
n
ystyIC
)(±= (populações infinitas)
5.2 VALORES POPULACIONAIS E ESTIMADORES CONSIDE-RANDO TODOS OS ESTRATOS
a) valor médio global (média estratificada)a1) média estratificada populacional
∑∑==
==L
hhh
L
hh
hest YWY
N
NY
11
a2) estimador da média estratificada
h
L
hhh
L
h
hest yWy
N
Ny ∑∑
==
==11
A estimativa da média estratificada ( esty ), geralmente, não apresenta o mesmo valor da média amostral ( y ).
n
yny
hn
hhh∑
== 1
A média estratificada ( esty ) e a média amostral ( y ) somen-te são coincidentes quando a fração amostral é a mesma para todos os estratos. Neste caso, a estratificação é definida com alocação ou partilha proporcional, fornecendo uma amostra au-toponderada, tendo-se:
88
Amostragem em inventário florestal Waldenei Travassos de Queiroz
N
n
N
n
h
h =
b) valor total globalb1) valor total global populacional
estYNY = b2) estimador do valor total global
estyNY =ˆ
c) variância da média estratificadac1) variância da média estratificada populacional
)()(1
h
L
h
hest y
N
NVyV ∑
=
= . Então:
∑ ∑= =
−==
L
h
L
h h
hh
h
hhhhest N
nN
n
yVWyVWyV
1 1
22 )()(
)()(
c2) estimador da variância da média estratificada
∑=
−=
L
h h
hh
hhest N
nN
n
yVWyV
1
2 )()(ˆ
)(ˆ
Desenvolvendo, tem-se:
∑∑==
−=L
h
hhL
h h
hest N
yVW
n
yVWyV
11
2 )(ˆ)(ˆ)(ˆ
d) erro padrão da média estratificadad1) erro padrão da média estratificada populacional
∑ ∑= =
−=L
h
L
h
h
h
hhest N
yVW
n
yVWyS
1 1
2 )()()(
89
Amostragem estratificada
d2) estimador do erro padrão da média estratificada
∑∑
=
=−=L
h
L
hhh
h
hest N
yVW
n
yVWys
1
12 )(ˆ
)(ˆ)(
e) intervalo de confiança para o valor médio global IC )( estest ystyIC ×±=
Para a obtenção do valor “t” tabelar, recomenda-se proce-der da seguinte forma:
e1) tomar t = 2 se a amostra é grande;
e2) se a amostra é pequena e se os estratos possuem ba-sicamente a mesma variância, toma-se como número final de graus de liberdade a soma dos graus de todos os estratos:
;)1(1
��
��L
h
hGLnn
e3) se a amostra é pequena e as variâncias dos estratos são diferentes (heterogêneas), calcula-se o número de graus de liberdade pelo método de Satterthwaite (1946), ou seja:
�
�
�
�
�
�L
h h
hh
L
h
hh
Gl
n
yVg
yVg
n
1
22
2
1
1
)(
])([
, onde .)(
h
hhhh n
nNNg
−=
90
Amostragem em inventário florestal Waldenei Travassos de Queiroz
f) intervalo de confiança para o valor total global
)]([)ˆ(ˆestest ystyNYstYIC ����� �
g) dimensionamento da amostra acidental estratificada
Na amostragem estratificada, a definição do tamanho da amostra se faz, fundamentalmente, através de duas formas de alocação ou partilha nos estratos.
1) Alocação ou partilha proporcional.
2) Alocação ou partilha ótima.
1) Alocação ou partilha proporcional
Na alocação proporcional, a definição do número de uni-dades n da amostra é obtida atendendo-se à proporcionalidade dos estratos:
N
N
n
n hh = , para nh = nWh
Dada a fórmula da variância da média estratificada estima-da:
∑∑==
−=L
h
hL
h h
hhest N
yVW
n
yVWyV
11
2 )(ˆ)(ˆ)(ˆ
Substituindo hn por nh = nWh , tem-se:
� �� �
��L
h
L
h
hh
h
hh
estN
yVW
nW
yVWyV
1 1
2)(ˆ)(ˆ
)(ˆ
Seja E = )( estyst × a semiamplitude do intervalo de confian-
ça ou expectância do erro. Então:
91
Amostragem estratificada
)(ˆ)]([ 2222
estest yVtystE ��
])(ˆ1)(ˆ[
11
2
22
����
��L
h
h
L
h h
h yVWNnW
yVWtE
����
��L
h
hh
L
h
hh yVWN
tyVW
n
tE
1
2
1
22
)(ˆ)(ˆ
����
��L
h
h
L
h
h yVWN
tEyVW
n
t
1
2
1
22
)(ˆ)(ˆ
����
��
L
h
h
L
h
h yVWN
tEnyVWt
1
2
1
22)](ˆ[)(ˆ
�
�
�
�
�
�L
h
h
L
h
hh
yVWN
tE
yVWt
n
1
22
1
2
)(ˆ
)(ˆ
A partilha dentro dos estratos é feita de tal forma que nh = nWh.
2) Alocação ou partilha ótima
Na alocação ótima, a definição da intensidade de amostra-gem n e as grandezas amostrais nos estratos nh são definidas tendo em vista tornar mínimo o valor da variância da média es-tratificada )( estyV dentro de determinado limite de custo ou tor-nar mínimo o custo para um valor fixado de V( esty ).
Seja a função custo linear mais simples a ser utilizada na dedução:
∑=
+=++++=L
hhhLL nCCnCnCnCCC
1022110 ...
92
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Sendo:
C = custo total do inventário florestal;C0 = despesas gerais (fixas);Ch = custo médio de medição por unidade medida no h-
ésimo estrato.
Para atender a condição de tornar mínimo o custo para um valor especificado da variância da média estratificada, ou torná-la mínima para um determinado limite de custo, resulta em um problema de estudo de mínimo condicionado. Neste caso, usar o processo de cálculo dos coeficientes de Lagrange, para tornar mínimo o valor de )( estyV , respeitando a seguinte restrição:
02211 CCnC...nCnC LL −=+++.
Dado que:
∑∑==
−=L
hhh
L
h h
hhest yVW
Nn
yVWyV
11
2
)(1)(
)(
E a função de Lagrange Z:
∑=
+−+=L
hhhest CCnCyVZ
10 )()( l
Então, calcula-se hn e o coeficiente l tal que o valor de Z seja mínimo.
∑ ∑
= =
+−++++−=L
hLL
L
hhh
h
hh CCnCnCnCyVWNn
yVWZ
102211
1
2
)...()(1)(
l
Diferenciando em relação a hn (h = 1,...,L), tem-se:
93
Amostragem estratificada
112
1
1
2
1)
)(( dnC
n
yVWdZ ����
222
2
2
2
2 ))(
( dnCn
yVWdZ ����
...
hh
h
hh dnCn
yVWdZ )
)((
2
2
����
...
LL
L
LL dnCn
yVWdZ )
)((
2
2
����
Igualando as derivadas parciais a zero, têm-se:
1
111
)(
C
ySWn =l
...
h
hhh
C
ySWn
)(=l (5.1)
...
L
LLL
C
ySWn
)(=l
Efetuando-se o somatório para todos os estratos, tem-se:
∑=
=L
h h
hh
C
ySWn
1
)(l (5.2)
Finalmente, dividindo membro a membro as expressões 5.1 e 5.2, obtém-se:
94
Amostragem em inventário florestal Waldenei Travassos de Queiroz
∑=
=L
hhhh
hhhh
CySW
CySW
n
n
1
)/)((
/)(
∑=
=L
hhhh
hhhh
CySW
CySWnn
1
)/)((
/)( (5.3)
A Expressão 5.3 recomenda dimensionar uma amostra maior no estrato, se:
a) o estrato é maior;b) o estrato possui maior variância; c) a medição de campo é mais barata no estrato.Para obter a fórmula para o número definitivo de unidades
de amostra (n) através das estimativas de )(yVh , deve-se fixar a semiamplitude do intervalo de confiança ou expectância do erro
).( estystE ×= ). Logo:
)(ˆ)( 2222estest yVtystE ==
Por conseguinte:
∑ ∑= =
−=L
h
L
hh
h
h yVWNn
yVWtE
1 1
222 ])(ˆ1)(ˆ[
Substituindo hn dado pela Expressão 5.3, tem-se:
��
�
��
�
��L
h
h
L
h
L
h
hhh
hhh
hh yVWN
CysW
CysWn
yVWtE
11
1
2
22 )](ˆ1
/)(
/)(
)(ˆ[
95
Amostragem estratificada
])(
()/)([)(ˆ11
2
1
22 ∑∑∑
===
=+L
h
hhhL
hhhh
L
hh n
CysWCysWtyVW
N
tE
])(()/)([])(ˆ[11
2
1
22
hh
L
hh
L
hhhh
L
hhh CysWCysWtyVW
N
tEn ∑∑∑
===
=+
Resultando:
�
� �
�
� �
�
�L
h
hh
L
h
L
h
hhhhhh
yVWN
tE
CysWCysWt
n
1
2
2
1 1
2
)(ˆ
])()(/)([
(5.4)
Se forem admitidos custos iguais para medição das unida-des de amostra nos estratos, tem-se a denominada Partilha de Neyman e as Equações 5.4 e 5.3 passam a ser escritas respec-tivamente por:
,
)(ˆ
])([
122
2
1
2
N
yVWtE
ysWtn
L
hh
L
hhh
∑
∑
=
=
+
= sendo ∑
=
=L
hhh
hhh
ysW
ysWnn
1
)(
)( .
5.3 PRECISãO DA AMOSTRA ESTRATIFICADA EM RELAçãO À AMOSTRA SIMPLES AO ACASO
Quando a estratificação é empregada de forma eficien-te, resulta para os valores da média e do total estimados uma menor variância que a amostra simples ao acaso de grandeza
������
��L
h
hh
L
h hhh
hhL
h
hhh yVWN
t
CysnW
yVWCysWtE
1
2
1
2
1
22 )(ˆ]/)(
)(ˆ()/)([
96
Amostragem em inventário florestal Waldenei Travassos de Queiroz
similar. Por outro lado, não é verdadeiro afirmar que qualquer amostra estratificada seja mais precisa que uma amostra sim-ples ao acaso, considerando-se uma mesma fração amostral. Por exemplo, se em uma amostra estratificada os valores de nh estiverem muito diferentes do ótimo, obviamente a amostragem estratificada poderá ser menos precisa.
Do exposto, pode-se dizer que a finalidade principal da es-tratificação é diminuir a variância da média e a variância do total, quando comparadas com suas similares da amostra simples ao acaso.
Considerando as populações infinitas e para uma mesma grandeza amostral n, sejam as variâncias das médias nos se-guintes casos:
a) variância da média da amostra simples ao acaso
n
yVyVAsa
)()( =
b) variância da média (alocação proporcional)
VProp � �� �� �� �
����L
h
L
h
hhhhL
h
L
h h
hh
h
hh
opnN
yVN
n
yVW
nW
yVW
n
yVWyV
1 11 1
22
Pr
)()()()()(
c) variância da média (alocação ótima)
2
1
2
1
1
2
1
2 )]([
)(
)(
)()()(
nN
ySN
ySW
ySWn
yVW
n
yVWyV
L
h
hhL
h
L
h
hh
hh
hhL
h h
hh
Oti
��
�
��
�
�
�
���
Dado que .1
)(
)( 1 1
2
�
�
�
��� �
N
Yy
yV
L
h
N
i
hi
h
97
Amostragem estratificada
Então, .)()()1(1 1
2∑∑= =
−=−L
h
N
ihi
h
YyyVN
Efetuando-se a partição da variação total nos componen-tes de variância entre e dentro dos estratos:
∑ ∑= =
−+−=−L
h
L
hhhhh YYNyVNyVN
1 1
2)()()1()()1(
Então:
∑ ∑= =
−+−=−L
h
L
hhhh
hhh YYNyV
NNyV
NN
1 1
2)()()1
1()()1
1(
Desprezando-se as frações 1/N e 1/Nh: NVh (y) ∑ ∑
= =
−+=L
h
L
hhhhhh YYNyVNyNV
1 1
2)()()( Dividindo-se por nN, tem-se:
Pelas definições de )(yVAsa e VProp )(Pr yV op :
)()( Pr yVyV opAsa = VProp )(Pr yV op +
n
YYWL
hhh∑
=
−1
2)(
Pelo exposto, conclui-se que a variância da média da
amostra simples ao acaso será maior que a variância da média da amostra estratificada com alocação proporcional, quando as médias entre os estratos forem diferentes entre si, ou seja, a estratificação somente será eficiente se existirem diferenças sig-nificativas entre as médias dos estratos.
nN
YYN
nN
yVN
n
yV
L
h
hh
L
h
hh ����
�
�� 1
2
1
)()()(
98
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Deduz-se, facilmente, que a amostra simples ao acaso terá a mesma precisão da amostra estratificada se houver uma igual-dade completa entre as médias dos estratos. Considerando ser uma afirmação verdadeira que a alocação ótima adiciona preci-são na amostragem estratificada, então:
Denominando-se ∑
∑=
= ==L
hhh
L
hhh
ySWN
ySNyS
1
1 )()(
)( :
Finalmente:
2
1
2
1Pr
)]([)(
)()(nN
ySN
nN
yVN
yVyV
L
h
hh
L
h
hh
Otiop
���� ���
}
)]([
)({1
)()( 1
2
1
PrN
ySN
yVNnN
yVyV
L
h
hhL
h
hhOtiop
��
�
�
���
���
�
�� ����L
h
L
h
hh
L
h
hh
hhOtiopN
ySN
N
ySN
yVNnN
yVyV1
1
2
1
2
Pr}
)]([)]([2
)({1
)()(
��� �
�
�� �����
L
h
L
h
hh
L
h
L
h
hhhh
hhOtiopN
ySNN
N
ySNySN
yVNnN
yVyV1
2
1
2
1 1
Pr }
)]([])()][([2
)({1
)()(
]}
)]([)]()[(2
)([{1
)()(2
1
2
1
1
PrN
ySN
N
ySNyS
yVNnN
yVyV
L
h
hh
L
h
hhhL
h
hhOtiop
���
��
�
����
}]
)(
)([{1
)()( 21
1
PrN
ySN
ySNnN
yVyV
L
h
hh
h
L
h
hOtiop
��
�
�
���
��
�
�
�
����L
h
l
h
hh
hhotiopn
ySySW
ySySNnN
yVyV1
1
2
2
Pr
)]()([
)]()([1
)()(
n
ySySW
yVyV
l
h
hh
otiop
��
�
�� 1
2
Pr
)]()([
)()(
99
Amostragem estratificada
O resultado acima revela que, quando existir heterogenei-dade de variâncias entre os estratos, a alocação ótima é mais precisa que a alocação proporcional.
exercício 5.1
Seja uma área florestal de 10.000 ha, onde, através de téc-nicas de interpretação de imagens fotográficas, foram detecta-dos três estratos:
Estrato I (floresta alta sem babaçu) = 2.000 ha.Estrato II (floresta alta com babaçu) = 5.000 ha.Estrato III (floresta baixa cipoálica) = 3.000 ha.
Foram selecionadas nos estratos, através da amostra sim-ples ao acaso, as seguintes quantidades de unidades de amos-tra: n1 = 13; n2 = 15 e n3 = 12.
A estrutura da unidade amostral apresentou uma forma retangular de 10 m de largura e 250 m de comprimento, onde foram mensuradas todas as árvores com DAP 45 cm. Na Ta-bela 5.1, encontram-se os dados (simulados) por estrato para os volumes por parcela de 0,25 ha.
tabela 5.1 - Volumes em m3 por parcela de 0,25 ha.
ESTRATO I ESTRATO II ESTRATO III
21,1034,0018,0020,0055,0023,4240,5017,44
22,1225,0031,2017,0524,10
12,9017,009,50
20,0030,1023,4221,1017,44
22,1212,0016,5017,0524,1016,7121,80
8,1012,009,50
14,5018,1721,1010,807,50
6,5012,505,205,10
100
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Análise estatística relativa ao estrato I
a) valor médio estimado
b) valor total estimado
3111 15,726.214840769,26000.8ˆ myNY =×== 8.000 x 26,840769 = 214.726,15 m3
Sendo: N1 = Área/T.U.A = 2.000 ha/0,25 ha = 8.000
T.U.A = Tamanho da Unidade de Amostra
c) variância estimada
d) desvio padrão estimado
e) variância da média estimada
hamn
y
y
n
i
i
25,0/840769,2613
93,348 3
1
1
1
1
1
���
��
hamy /36,1073
1�
23
2
1
1
1
2
1
1
2
1
1 )25,0/(73394,11912
13/93,3483569,10802
1
)(
)(ˆ
1
1
hamn
n
y
y
yV
n
i
in
i
i
��
��
�
�
��
�
�
23
1 )/(7431,1915)(ˆ hamyV �
hamyVys /77,43)(ˆ)(3
11 ��
23
1
11
1
1
1)/(12539,147)
000.8
13000.8(
13
7431,1915)(
/)(ˆ)(ˆ ham
N
nN
n
hayVyV �
�
�
�
�
101
Amostragem estratificada
f) erro padrão estimado
g) coeficiente de variação estimado
h) intervalo de confiança
Limite inferior para o valor médio )( 111 ysty ×− =107,36308-2,1788 x 12,129525 = 80,94 m3/ ha
Na Tabela 3 do Anexo, tem-se o valor tabelar, ta/2, n1–1 = 2,1788, para a = 0,05 e n1 -1=12.
Limite superior para o valor médio)( 111 ysty ×+ = 107,36308+2,1788x12,129525=133,79 m3/ ha
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato I encontra-se no inter-valo de 80,94 m3/ ha a 133,79 m3/ ha.
Limite inferior para o valor total área[ )( 111 ysty ×− ]= 2.000 x 80,935271= 161.870,54 m3
Limite superior para o valor totalárea )]([ 111 ysty ×+ )] = 2.000 x 133,79089 = 267.581,78 m3
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato I encontra-se no interva-lo de 161.870,54 m3 a 267.581,78 m3.
hamhayVys /13,1212539,147/)(ˆ)(3
11 ���
%77,4010036308,107
769203,43100
)(%ˆ
1
1
1 �����
y
ysVC
102
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Análise estatística relativa ao estrato II
a) valor médio estimado
2y = 75,13 m3/ ha
b) valor total estimado
222 yNY = = 20.000 x 18,782667 = 375.653,33 m3
Onde N2 = Área/T.U.A = 5.000 ha/0,25 ha = 20.000
c) variância estimada
d) desvio padrão estimado
e) variância da média estimada
hamn
y
y
n
i
i
25,0/782667,1815
74,281 3
2
1
2
2
2
���
��
23
2
2
2
2
1
2
1
2
2
2)25,0/(801607,27
14
15
74,281051,681.5
1
)(
)(ˆ
2
2
hamn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
��
�
�
�)(ˆ2 yV 444,8257 23 )/( ham
hamhayVys /09,21/)(ˆ)(3
22 ��
23
2
22
2
2
2 )/(632805,29)000.20
15000.20(
15
8257,444)(
/)(ˆ)(ˆ ham
N
nN
n
hayVyV �
�
�
�
�
103
Amostragem estratificada
f) erro padrão estimado
g) coeficiente de variação estimado
h) intervalo de confiança Limite inferior para o valor médio
)( 222 ysty ×− = 75,130667 - 2,1448 x 5,4436022 = 63,46 m3/ ha
Na Tabela 3 do Anexo, tem-se o valor tabelar ta/2, n2–1 = 2,1448 para a = 0,05 e n2 - 1 = 14.
Limite superior para o valor médio)( 2222 ysty ×+ =75,130667+2,1448 x 5,4436022=86,81 m3/ ha
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato II encontra-se no in-tervalo de 63,46 m3/ ha a 86,81 m3/ ha.
Limite inferior para o valor total área [ )( 222 ysty ×− ]= 5.000 x 63,45523= 317.276,150 m3
Limite superior para o valor totalárea )([ 222 ysty ×+ ] = 5.000 x 86,806105= 434.030,53 m3
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato II encontra-se no inter-valo de 317.276,150 m3 a 434.030,53 m3.
hamhayVys /44,5/)(ˆ)(3
22 ��
%07,2810013,75
09,21100
)(%ˆ
2
2
2�����
y
ysVC
104
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Análise estatística relativa ao estrato III
a) valor médio estimado
hamn
y
y
n
i
i
25,0/914267,1012
97,130 3
3
1
3
3
3
���
��
3y = 43,66 m3/ ha
b) valor total estimado
== 333 yNY 12.000 x 10,914267 = 130.971,204 m3 Para N3 = Área/T.U.A = 3.000 ha/0,25 ha = 12.000 c) variância estimada
23
2
3
3
2
1
3
1
2
3
3)25,0/(498227,25
11
12
97,1399089,1709
1
)(
)(ˆ
3
3
hamn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
��
�
�
�)(ˆ3 yV 407,9716
23)/( ham
d) desvio padrão estimado
hamhayVys /20,209716,407/)(ˆ)( 3
33���
e) variância da média estimada23
3
33
3
3
3 )/(963637,33)000.12
12000.12(
12
97162,407)(
/)(ˆ)(ˆ ham
N
nN
n
hayVyV �
�
�
�
�
f) erro padrão estimado
hamhayVys /83,5963637,33/)(ˆ)(3
33���
105
Amostragem estratificada
g) coeficiente de variação estimado
%27,46100656667,43
198307,20100
)(%ˆ
3
3
3 �����
y
ysVC
h) intervalo de confiança Limite inferior para o valor médio
)( 333 ysty ×− = 43,656667 - 2,2010 x 5,827833=30,83 m3/ ha
Na Tabela 3 do Anexo, tem-se o valor tabelar,ta/2, n3–1 = 2,2010, para a = 0,05 e n3-1 = 11.
Limite superior para o valor médio )( 333 ysty ×+ = 43,656667 + 2,2010 x 5,827833=56,48 m3/ ha
Há razão para afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato III encontra-se no intervalo de 30,83 m3/ ha a 56,48 m3/ ha.
Limite inferior para o valor totalárea [ )( 333 ysty ×− ]= 3.000 x 30,829607= 92.488,82 m3
Limite superior para o valor total área [ )( 333 ysty ×+ ]= 3.000 x 56,483727= 169.451,18 m3
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato III encontra-se no inter-valo de 92.488,82 m3 a 169.451,18 m3.
106
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Análise estatística global
a) média estratificada estimada
91,10000.40
000.127827,18
000.40
000.208408,26
000.40
000.8
1
������� ��
L
h
hhestyWy
hamyest 25,0/0338,183
� , onde:
hamyest
/14,723
�
b) variância da média estratificada
Sejam os seguintes cálculos auxiliares:
0230089,1)(ˆ
)()(ˆ
)()(ˆ
)()(ˆ
3
323
1 2
222
1
1212
=++=∑= n
yV
N
N
n
yV
N
N
n
yV
N
N
n
yVWL
h h
hh
49706,45)(ˆ)(ˆ)(ˆ)(ˆ3
3
2
2
1
1
1
������
yVN
NyV
N
NyV
N
NyVW
L
h
hh
Então:
49706,45000.40
102300,1
)(ˆ)(ˆ)(ˆ
11
2
����� ����
L
h
hhL
h h
hh
estN
yVW
n
yVWyV
23 )25,0/(021872,1)(ˆ hamyV est �
23)/(3499,16)(ˆ hamyV est �
c) erro padrão da média estratificada
hamhayVys estest /04,4/)(ˆ)(3��
107
Amostragem estratificada
d) intervalo de confiança para a média estratificada
Considerando que a amostra é pequena e que há heteroge-neidade entre as variâncias, deve-se proceder ao cálculo do número de graus de liberdade (ngl) pelo método de Satterthwaite (1946). A Tabela 5.2 apresenta os cálculos a serem utilizados neste método.
h
hhh
hn
)nN(Ng
��
�
�
�
�
�
�L
h h
hh
L
h
hh
gl
n
yVg
yVg
n
1
22
1
2
1
)(ˆ
)](ˆ[
tabela 5.2 - Número de graus de liberdade – Método de Satterthwaite (1946).
EST hN hn )(h
hhhh n
nNNg
−= )(ˆ yVh )(ˆ yVg hh )1/()(ˆ 22 −hhh nyVg /(nh – 1)
I 8.000 13 4.915.076,92 119,7339 588.501.328,40 288,6115016x1014
II 20.000 15 26.646.666,67 27,8016 740.819.968,10 392,0101498x1014
III 12.000 12 11.988.000,00 25,4982 305.672.421,0 84,94148005x1014
Total 40.000 40 1.634.993.718,0 765,5631319x1014
92,34105631319,765
163499371814
2
�
�
�gl
n
ngl = 35 graus de liberdade
Na Tabela 3 do Anexo, tem-se o valor tabelar ta/2, ngl = 2,0317
para a = 0,05 e ngl = 35.
Limite inferior para o valor médio)( estest ysty ×− = 72,13507 - 2,0317 x 4,0435063=63,92 m3/ ha
Limite superior para o valor médio)( estest ysty ×+ = 72,13507 + 2,0317 x 4,0435063=80,35 m3/ ha
108
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Há razão para afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 63,92 m3/ ha a 80,35 m3/ ha.
Limite inferior para o valor total área [ )]([ estest ysty ×− – t x s ( )]([ estest ysty ×−)] = 10.000 x 63,919878 = 639.198,78 m3
Limite superior para o valor total área [ )]([ estest ysty ×− – t x s ( )]([ estest ysty ×−)] = 10.000 x 80,350262 = 803.502,62 m3
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 639.198,78 m3 a 803.502,62 m3.
e) limite de erro para o inventário florestalE = )( estyst× = 2,0317× 4,0435063 = 8,2151917 m3/ ha
%39,1110013507.72
211917,8100% �����
es ty
ELE
f) dimensionamento da amostra estratificada
Considerar o limite de erro para o inventário florestal de 10%. Na análise, o resultado obtido para a variável resposta vo-lume para as árvores com DAP 45 cm foi de 11,39 %, para as 40 unidades de amostra. Então, deve-se calcular o número de unidades de amostra, visando atender ao limite de erro estipula-do de LE = 0,10 e alocar as unidades por estrato, e, finalmente, calcular o número de unidades faltantes por estrato, o que será feito a seguir, utilizando-se os métodos de alocação proporcional e alocação ótima.
109
Amostragem estratificada
f1) alocação proporcional
E = LE esty× = 0,10×18,033767 = 1,8033767 m3
49706,45)(ˆ)(ˆ)(ˆ)(ˆ3
32
21
1
1
������
yVN
NyV
N
NyV
N
NyVW
L
h
hh
66,57
000.40
49706,450317,28033767,1
49706,450317,2
)(ˆ
)(ˆ
22
2
1
2
2
1
2
��
�
��
�
�
�
�
�
�
N
yVWt
E
yVWt
nL
h
hh
L
h
hh
n = 58 unidades de amostra Logo, pelo critério da proporcionalidade, tem-se:
ESTRATO I: �� 11 nWn 53,11000.40
000.866,57 ��
121
�n unidades
ESTRATO II: 83,28000.40
000.2066,5722 ���� nWn
292
�n unidades
ESTRATO III: 30,17000.40
000.1266,57
33���� nWn
3n = 18 unidades
f2) alocação ótima Dado que:
)()()()( 3
1
3
2
2
1
1 ysN
Nys
N
Nys
N
NysW
L
h
hh��
���
498227,25000.40
000.1280161,27
000.40
000.2073394,119
000.4
000.8)(
1
��������
L
h
hh ysW
��
�L
h
hh ysW1
)( 6,3396948
110
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Então:
9046526,50
000.40
49706,45031,28033767,1
3396948,6031,2
)(ˆ
])([
2
2
22
1
2
2
2
1
2
��
�
��
�
�
�
�
�
�
N
yVWt
E
ysWt
nL
h
hh
L
h
hh
n = 51 unidades de amostra.
Logo, pelo critério de otimização, têm-se:Estrato I:
57,173397,6
1885,290,50
)(
)(
1
11
1 ����
��
L
h
hh ysW
ysWnn
1n = 18 unidades de amostra.
Estrato II:
17,213397,6
6364,290,50
)(
)(
1
222 ����
��
L
h
hh ysW
ysWnn
2n = 22 unidades de amostra
Estrato III:
16,123397,6
5149,190,50
)(
)(
1
333 ����
��
L
h
hh ysW
ysWnn
3n = 13 unidades de amostra
g) discussão sobre a eficiência entre as alocações propor-cional e ótima
111
Amostragem estratificada
A seguir, far-se-á uma discussão sobre a eficiência entre as alocações ótima e proporcional. Para facilitar a análise, a Tabela 5.3 apresenta os resultados do dimensionamento dessas aloca-ções para o limite de erro de 10%, assim como uma coluna com os números de unidades medidas no inventário florestal referen-te ao limite de erro de 11,39%. A Tabela 5.4 mostra os valores das médias e das variâncias por estrato.
tabela 5.3 - Dimensionamento das alocações ótima e proporcional.
ESTRATOALOCAÇÃO
ÓTIMA (LE=10%)ALOCAÇÃO
PROPORCIONAL (LE=10%)Nº. UNID. MEDIDAS(LE=11,39%)
IIIIII
182213
122918
131512
TOTAL 53 59 40
tabela 5.4 - Médias e variâncias por estrato.
ESTRATO hy (m3/ha) )(ˆ yVh /ha
IIIIII
107,3675,1343,66
1915,7431 444,8257 407,9716
Considerando os resultados expostos, obtêm-se as se-guintes conclusões:
a) os resultados mostram que as médias dos estratos são muito diferentes entre si. Pode-se, então, concluir que a estrati-ficação foi eficiente, mesmo utilizando a alocação proporcional;
b) os resultados demonstram que há diferenças entre as variâncias dos estratos II e III em relação à variância do estrato I. Conclui-se, dada a existência de heterogeneidade de variâncias entre os estratos, que o emprego da alocação ótima resultará numa maior precisão em relação à utilização da alocação pro-porcional;
112
Amostragem em inventário florestal Waldenei Travassos de Queiroz
c) o exemplo ilustrativo acima exposto evidencia a maior precisão da alocação ótima, visto necessitar, para atender um limite de erro de LE = 0,10, de menos unidades de amostra que a alocação proporcional. Para atender ao limite de erro de LE = 0,10 e um nível de confiança de 0,95, deve-se, através da aloca-ção ótima, retornar ao campo e medir nos estratos I, II e III, res-pectivamente, mais 5, 7 e 1 unidades de amostra e, assim, totali-zar 53 unidades. Entretanto, se a opção fosse utilizar a alocação proporcional, haveria a necessidade de voltar ao campo e medir nos estratos II e III, respectivamente, mais 14 e 6 unidades de amostra e, assim, totalizar 60 unidades, visto que o estrato I foi superdimensionado em 1 unidade.
5.4 INVENTáRIO FLORESTAL APRESENTANDO SUBPOPULA-çõES COM DIFERENTES INTENSIDADES DE AMOSTRAGEM
Em levantamentos florestais, principalmente de áreas exten-sas, muitas vezes é necessário classificar subáreas de acordo com a sua importância tipológica ou estratégica, tal que determinados estratos sejam medidos com intensidades amostrais diferenciadas.
Seja o caso do Inventário Florestal Nacional (IFN) do Brasil que foi planejado para um grid de 20 km x 20 km. O processo de implantação dessa rede amostral na região Amazônica, pelas suas características diferenciadas, pode ser objeto de uma abor-dagem específica devido às condições naturais de acesso e de extensão territorial e, principalmente, em relação ao alto custo do levantamento.
A Amazônia Legal Brasileira abrange uma área de aproxi-madamente 5.217.423 km2 e estima-se que a floresta Amazô-nica ocorra em cerca de 3.300.000 km2. Então, considerando uma rede de unidades com distribuição sistemática segundo a
113
Amostragem estratificada
definição de um grid de 20 km x 20 km, pode-se obter aproxima-damente 8.250 pontos amostrais.
Havendo limitação de recursos financeiros para promover a medição de todos os 8.250 pontos da rede estabelecida, é imprescindível promover um estudo através de sensoriamento remoto, visando selecionar as áreas de acordo com suas prio-ridades em termos de grau de precisão. Por outro lado, uma variável importante, obviamente, será o custo médio por unidade de amostra por estrato. Este custo médio, evidentemente, está intimamente relacionado às dificuldades de acesso aos estratos.
Através de técnicas de sensoriamento remoto pode ser construído um mapa, o qual pode apresentar as estradas, rios navegáveis, pistas de pouso, organizações de apoio civis e mi-litares e outros. Este mapa deverá servir de base para delimitar as áreas (estratos) de acordo com o seu grau de dificuldade (acessibilidade ou outros atributos estratégicos), assim como em função dos custos. Havendo estratos com diferentes intensida-des de amostragem, o dimensionamento amostral e a análise estatística poderão ser realizados através da Amostra Estratifi-cada com Partilha ótima.
A estratificação da floresta com o objetivo de estabelecer estratos com diferentes intensidades de amostragem pode ser considerada como uma estratificação por razão administrativa, visto que não objetiva diretamente ganhar precisão ou tirar con-clusões sobre as características tipológicas.
exercício 5.2
Seja o exemplo em que os estudos sobre a acessibilidade e os custos médios de medição por estrato resultaram nas se-guintes decisões:
114
Amostragem em inventário florestal Waldenei Travassos de Queiroz
1) 40 % dos pontos da floresta Amazônica (estrato I) serão medidos segundo o grid definido de 20 km x 20 km;
2) os 60 % restantes serão classificados em três estratos (II, III, IV) e diferenciados em relação ao nível de acessibilidade e custos na medição das parcelas.
A partir de estudos de campo e bibliográfico, foram obtidas as seguintes informações acerca dos três estratos (II, III, IV). Ver Tabela 5.5.
tabela 5.5 - Dados por estrato: definição da intensidade de amostragem.
Estratos Wh sh (y) : (m3/ha) Ch hhh CysW /)(
II 0,5 11 1000 0,173925
III 0,3 9 3000 0,049295
IV 0,2 6 5000 0,016971
Total 1,0 0,240191
Wh é o peso do h-ésimo estrato; sh(y) é o desvio padrão do h-ésimo estrato;Ch é o custo médio de medição das parcelas no i-ésimo
estrato.Seja C= c1n1+c2n2+c3n3+c4n4 o custo total de medição, tal
que o componente c1n1 refere-se ao custo dos 40 % da floresta medido segundo o grid definido de 20 km x 20 km; o componente c2n2+c3n3+c4n4 refere-se à medição dos três estratos referentes aos 60 % da floresta que serão dimensionados a partir de graus de precisão diferentes.
Dado C= C’+ C’’.Tal que:C’ = c1n1; C”= c2n2+c3n3+c4n4.
115
Amostragem estratificada
Então, estabelecer o procedimento para definir os grid para os estratos II, III e IV, considerando os seguintes tamanhos de amostra n2, n3, e n4. O valor para n1 do estrato I já está definido em função do grid 20 km x 20 km.
Dado que:
∑=
=L
hhhh
hhhh
CysW
CysWnn
2
''
)/)((
/)( , sendo 432'' nnnn ++= .
Pela partilha da alocação ótima, têm-se:
''''
2
222''2 724111,0
240191,0
173925,0
)/)((
/)(nn
CysW
CysWnn
L
hhhh
===
∑=
''''
2
333''3 205233,0
240191,0
049295,0
)/)((
/)(nn
CysW
CysWnn
L
hhhh
===
∑=
''''
2
444''4 070654,0
240191,0
016971,0
)/)((
/)(nn
CysW
CysWnn
L
hhhh
===
∑=
Fixando-se o custo C’’, pode-se obter o valor de n’’ da se-guinte forma:
Substituindo, n2 = 0,724111n’’, n3 = 0,205233n’’ e n4 = 0,070654n’’, em C”= c2n2+c3n3+c4n4.
Tem-se:'''''''' 070654,05000205233,03000724111,01000 nnnC ××+××+××=
Portanto:
08,693.1
''
''C
n �
116
Amostragem em inventário florestal Waldenei Travassos de Queiroz
A partir do conhecimento do valor de n”, calcular n2, n3 e n4:
;724111,0 ''2 nn ×= ;205233,0 ''
3 nn ×=
.070654,0 ''4 nn ×=
Então, conhecendo-se as áreas dos estratos II, III, IV e os valores de n2, n3 e n4, é possível dimensionar os grid correspon-dentes aos estratos II, III e IV.
Outro procedimento para obter n’’ seria usar a fórmula 5.4 para ;4,3,2=h estabelecendo uma determinada semiamplitude de intervalo de confiança ( E = LE )estyLEE ×= .
�
� �
�
� �
�
�4
2
2
2
2
4
2
4
2
2
''
)/()((
h
hh
h h
hhhhhh
sWN
tE
CsWCsWt
n
cApítulo 6
AmostrAgem sIstemátIcA
Define a amostragem sistemática mostrando as diferen-ças, vantagens e desvantagens com relação à amostragem sim-ples ao acaso na aplicação em inventários florestais. Apresenta recomendações para obter a variância da média através de uma única amostra sistemática. Compara a precisão da amostragem sistemática em relação à amostra simples ao acaso. Mostra um exercício completo comparando várias alternativas para análise de um inventário florestal com amostragem sistemática.
119
Amostragem sistemática
A amostragem sistemática consiste em sortear uma uni-dade da população e, a partir dela, para constituir uma amostra de tamanho n, selecionar as unidades que ocupam de forma sequencial as posições múltiplas de um determinado valor K = N/n pré-estabelecido, onde N é o número de unidades total da população.
A amostragem sistemática apresenta uma diferença mar-cante com relação à amostragem simples ao acaso, no que tan-ge ao número de amostras possíveis.
Seja uma população composta por N unidades e n repre-sente o tamanho da amostra, sendo N = Kn. Se a amostragem for sistemática, o número de amostras possíveis é igual a K = N/n, enquanto que, em se tratando de uma amostra simples ao acaso sem reposição, o número de amostras possíveis (nap) será:
)!(!
!
nNn
NCnapn
N �
��
Então, teoricamente, uma amostra sistemática não pode
ser analisada como se fosse uma amostra simples ao acaso.A amostragem sistemática, quando comparada com a
amostra simples ao acaso, apresenta algumas vantagens, entre as quais:
a) a seleção das unidades amostrais, na amostragem sis-temática, é mais fácil e mais rápida;
b) a organização, a supervisão e a checagem (remedição) de algumas unidades da amostra se tornam operacionalmente mais fáceis;
c) o tamanho da população não precisa, necessariamente, ser conhecido;
d) as unidades da amostra sistemática se distribuem mais uniformemente na população, originando uma maior representa-
120
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tividade, tornando-se eficiente quando existe qualquer tendência ou concentração de certas características;
e) a amostragem sistemática é mais eficiente quando se deseja mapear a floresta com relação à sua tipologia.
A grande desvantagem da amostra sistemática ocorre quando a população apresenta dados com características cícli-cas ou periódicas, pois, corre-se o risco da amostragem refletir homogeneidade numa condição sabidamente heterogênea.
A amostragem sistemática, considerando uma mesma grandeza amostral, poderá ter uma precisão maior que a amos-tra simples ao acaso, desde que haja grande heterogeneidade entre as unidades dentro das amostras sistemáticas possíveis.
Sob o ponto de vista teórico, a variância da média da amostra sistemática somente poderá ser obtida desde que se disponha dos valores médios de todas as amostras sistemáticas possíveis ou, então, sejam conhecidos os valores verdadeiros da variância da população V(y) e da variância entre as unidades dentro das amostras sistemáticas Vd (y), o que corresponde a ter que enumerar ou levantar a população totalmente, não sendo factível em termos de inventários florestais.
Havendo a impossibilidade de se obter a variância da mé-dia através de uma única amostra sistemática, pode-se, em rela-ção a levantamentos florestais, contornar o problema utilizando uma das seguintes recomendações:
a) de acordo com Campos (1981), quando as observações inerentes à variável resposta estão distribuídas aleatoriamente por algum critério objetivo ou mesmo ocorrem na floresta segun-do leis naturais, pode-se analisar uma amostra sistemática como inteiramente ao acaso;
b) pode-se, em vez de retirar uma única amostra de ta-manho n, número de unidades a serem medidas no inventário,
121
Amostragem sistemática
selecionar um determinado número k’ de amostras de tamanho n’, de tal forma que implique em n = k’ n’ e, através delas, obter uma estimativa para a variância da média;
c) a amostragem sistemática pode ser associada à amos-tragem por conglomerados, pois quando se subdivide uma po-pulação de tamanho N em K amostras sistemáticas de tamanho n, na verdade obtêm-se K grandes unidades conglomeradas. Assim, cada amostra sistemática pode ser considerada uma unidade conglomerada inteiramente casualizada, selecionada de uma população composta por K conglomerados. Portanto, havendo a seleção de uma amostra sistemática, pode-se esti-mar a variância )(yV através de )(ˆ yV , obtida da maneira usual, através da análise de uma amostra consistindo de apenas um conglomerado selecionado aleatoriamente. A amostragem por conglomerado está apresentada no capítulo 9.
Por outro lado, de acordo com as considerações contidas no item b, e adicionando-se o exposto no item c, pode-se con-cluir que há uma amostra consistindo de k’ conglomerados se-lecionados aleatoriamente, podendo-se estimar a variância da média utilizando a estrutura de análise específica por conglome-rados.
Em termos de inventários florestais, existe a concepção da amostragem com múltiplos inícios aleatórios, onde a estrutura amostral é uma amostragem sistemática em dois estágios, con-vergindo para um procedimento aleatório. Neste caso, a estru-tura estatística é similar à da amostragem por conglomerados, podendo-se proceder a uma análise de variância para se esti-mar os componentes de variância entre e dentro das faixas.
122
Amostragem em inventário florestal Waldenei Travassos de Queiroz
6.1 VARIâNCIA DA MÉDIA
Para formular os parâmetros da amostragem sistemática, utilizar-se-á a seguinte notação:
N = número total de unidades da população;K = número de amostras sistemáticas possíveis;n = número de unidades pertencentes a cada amostra sis-
temática;yij
= Valor da variável resposta correspondente à j-ésima
observação da i-ésima amostra sistemática.Seja a expressão da variância da média da amostra siste-
mática:
K
YyyV
K
ii
Sist
∑=
−= 1
2)()(
iy = média da i-ésima amostra sistemática. Y = média das médias das possíveis amostras sistemáti-
cas.Seja a fórmula da variância populacional:
1
)(
)( 1 1
2
−
−=∑∑
= =
N
Yy
yV
K
i
n
jij
Então:
∑∑= =
−−+=−K
i
n
jiiij YyyyyVN
1 1
2)()()1(
∑∑∑== =
−+−=−K
iii
K
i
n
jij YynyyyVN
1
22
1 1
)()()()1( , pois,
.0))((1 1
��� �
���K
i
n
j
iiij Yyyy
123
Amostragem sistemática
Portanto:
)()()1()()1(1
ynKVyVnyVN Sist
K
ii +−=− ∑
=
)()(
)1()()1( 1 ynKVK
yVnKyVN Sist
K
ii
+−=−∑
=
Por conseguinte:
)()1(
)()1
()( yVN
nKyV
N
NyV dSist
−+
−= – )(
)1()()
1()( yV
N
nKyV
N
NyV dSist
−+
−= (6.1)
Sendo: )(yVi = variância das observações dentro da i-ésima amos-
tra sistemática;
)(yVd = média das variâncias de todas as amostras siste-máticas possíveis.
A Fórmula 6.1 é similar às Fórmulas 6.2 e 6.3. A Expressão 6.2 é baseada na variância das médias de todas as amostras sistemáticas possíveis, enquanto a 6.3 está escrita em função do coeficiente de correlação ( Sistd ) entre pares de unidades que pertencem à mesma amostra sistemática.
1
)()()( 1
2
−
−−
=∑
=
K
Yy
N
nNyV
K
ii
Sist (6.2)
])1(1[)(
)1
()( SistSist nn
yV
N
NyV d−+
−= (6.3)
Tal que:
)()1)(1(
)()1()1(
)(
))((
2 yVnKn
yVKnnQMK
YyE
YyYyEEntre
ij
iuij
Sist��
����
�
����
124
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Na expressão do Sistd , o numerador representa a média de todos os Kn(n-1) / 2 pares diferentes de unidades e o denomina-dor é a média de todos os Kn valores de yij. No capítulo sobre amostragem por conglomerados há mais informações sobre o coeficiente de correlação Sistd .
Como anteriormente observado, o grande inconveniente das Fórmulas 6.1, 6.2 e 6.3 é que se deve conhecer a variância ver-dadeira da população e a variância verdadeira entre as unidades dentro das amostras sistemáticas possíveis ou os valores médios verdadeiros. Entretanto, pode-se, com referência aos inventários florestais, utilizar os argumentos expostos no início deste capítulo.
6.2 PRECISãO DA AMOSTRA SISTEMáTICA COMPARADA À AMOSTRA SIMPLES AO ACASO
Sejam as fórmulas:a) variância da média da amostra simples ao acaso
n
yV
N
nNyVAsa
)()()(
−=
b) variância da média da amostra sistemática
)()1(
)()1
()( yVN
nKyV
N
NyV dSist
−−
−=
A amostra sistemática será mais precisa que a amostra
simples ao acaso, se:)()( yVyV AsaSist <
Logo:
n
yV
N
nNyV
N
nKyV
N
Nd
)()()(
)1()()
1(
−<
−−
−
125
Amostragem sistemática
Desenvolvendo, onde N = nK, tem-se:
n
yV
N
nyV
nK
nKyV
Nd
)()1()(
)1()()
11( ��
�
��
N
yV
n
yVyV
n
n
N
yVyV d
)()()(
)1()()( −<
−−−
)())1(
()(
)( yVn
n
n
yVyV d
−<−
V (y)( )()1
()1
)(( yVn
n
n
nyV d
−<
−
Sendo:
)()( yVyVd >
Concluindo-se que a maior heterogeneidade entre as uni-dades dentro das amostras sistemáticas resulta numa maior pre-cisão em relação às amostras simples ao acaso.
exercício 6.1
Seja uma área florestal com 250 ha, dividida em 1.000 uni-dades de 0,25 ha. Os dados amostrais foram retirados de uma população, simulada computacionalmente, com média e variân-cias conhecidas:
A Tabela 6.1 apresenta a análise de variância populacional.
tabela 6.1 - Análise de variância populacional.
CV GL SQ QM
Amostras (K) 19 1503,0 79,1053
Erro 980 136.158,0 138,9367
Total 999 137.661,0 137,7988
126
Amostragem em inventário florestal Waldenei Travassos de Queiroz
)25,0/(106,38 3 hamY �23 )25,0/(7988,137)( hamyV �
23 )25,0/(9367,138)( hamyVd �
1) Retirar uma amostra sistemática de 50 unidades e obter a variância da média pelas seguintes expressões:
)()1(
)()1
()( yVN
nKyV
N
NyV dSist
−−
−=
1
)()()( 1
2
−
−−
=∑
=
K
Yy
N
nNyV
K
ii
Sist
])1(1[)(
)1
()( SistSist nn
yV
N
NyV d−+
−=
2) Considerar os dados do item anterior (amostra sistemá-tica de 50 unidades) e obter a variância da média como se fosse inteiramente ao acaso (ASA).
n
yV
N
nNyVsist
)(ˆ)()(ˆ
2
−=
3) Retirar da população cinco amostras sistemáticas com 10 unidades cada e obter a variância da média por meio da ex-pressão da amostragem por conglomerados. Ver capítulo 9.
mn
yVff
n
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
211
13 ����
4) Dividir a população em vinte subpopulações com 50 uni-dades cada, sortear sistematicamente cinco delas e, em cada
127
Amostragem sistemática
uma, selecionar uma amostra sistemática de 10 unidades. Obter a variância da média pela expressão da Amostragem por Con-glomerados. Ver capítulo 9.
mn
yVff
n
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
211
13 ����
5) Retirar da população uma amostra aleatória de 50 uni-dades e obter a variância da média.
n
yV
N
nNyVAsa
)(ˆ)()(ˆ
4
−=
6) Discutir e concluir sobre os resultados
1) variância da média da amostra sistemática de 50 uni-dades pelas expressões (variâncias conhecidas)
)()1(
)()1
()( 1 yVN
nKyV
N
NyV dSist
−−
−=
tabela 6.2 - Dados da amostra sistemática de tamanho n = 50.
26,4 68,1 17,4 35,7 47,1 33,6 43,2 43,4 44,7 31,032,4 37,6 35,4 18,0 42,0 15,7 36,3 36,5 34,7 42,343,0 32,5 34,7 48,0 34,4 55,6 37,1 39,7 42,5 45,832,3 57,0 29,9 30,7 54,5 32,1 41,8 48,3 19,3 56,651,2 40,4 41,0 36,1 31,4 37,5 31,9 38,5 41,7 29,3
Dado que:
2050
000.1 ���n
NK
19161∑
=
=n
iiy
23)25,0/(7988,137)( hamyV �
128
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Então:
hamn
y
y
n
i
i
/32,3850
1916 31
1���
��
hamyVSist 25,0/503,19367,138000.1
)150(207988,137
000.1
1000.1)(
3
1 ��
��
�
1
)(
)(
1
)(
)()(
2
1
1
2
1
2
1�
��
��
��
�
��� �
��
K
K
y
y
N
nN
K
Yy
N
nNyV
K
i
iK
i
i
K
i
i
Sist
tabela 6.3 - Médias das K = 20 amostras sistemáticas.
35,690 37,042 38,140 39,274 38,266 37,22 37,596 38,134 38,844 39,144
40,464 38,828 38,448 35,342 37,648 39,66 39,196 38,244 37,99 36,946
Da Tabela 6.3 pode-se obter:
116,7621
��
�K
i
iy
09696,071.291
2
��
�K
i
iiy
Então:
503,119
20
116,76209696,071.29
)000.1
50000.1(
1
)(
)()(
2
2
1
1
2
1 �
�
��
��
��
�
�� �
�
K
K
y
y
N
nNyV
K
i
iK
i
i
Sist
])1(1[)(
)1
()( 1 Sis tSist nn
yV
N
NyV ���
��
)()1)(1(
)()1()1(
yVnKn
yVKnnQMKEntre
Sist��
�����
129
Amostragem sistemática
Da Tabela 6.1 pode-se obter:
059,389.745.6
9662,510.62
7988,137)150)(15020(
7988,137)15020(1053,7950)120( ��
���
������Sist�
380092672143,0059,389.745.6
9662,510.62��
��Sis t�
]80092672143,0)(150(1[50
7988,137)
000.1
1000.1()(
1���
��yV
Sist
23
1 )25,0/5030,1)( hamyVSist �
Conclui-se que os resultados comprovam a semelhança das três fórmulas.
2) variância da média da amostra sistemática de 50 uni-dades, analisada como inteiramente ao acaso (AsA)
n
yV
N
nNyVSist
)(ˆ)()(ˆ
2
−=
Pode-se obter da Tabela 6.2:
hamn
y
y
n
i
i
/32,3850
1916 31
2 ���
��
23
2
2
1
1
2
)25,0/(6693,10749
50
3,191691,719.78
1
)(
)(ˆ hamn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
�� �
�
Então:23
2 )25,0/(0457,250
6693,107)
000.1
50000.1(
)(ˆ)()(ˆ ham
n
yV
N
nNyVSist �
�
�
�
�
130
Amostragem em inventário florestal Waldenei Travassos de Queiroz
3) variância da média para as cinco amostras sistemá-ticas com 10 unidades (Amostragem por conglomerados)
Da população de N = 1.000 foram selecionadas sistemati-camente cinco amostras com 10 unidades. Neste caso K = 100.
tabela 6.4 - Dados das cinco amostras sistemáticas.
A1 A2 A3 A4 A51 47,1 37,6 26,6 36,7 48,92 31,0 46,0 52,6 38,8 72,23 42,0 48,1 39,9 24,3 34,34 42,3 21,4 34,9 34,8 50,65 34,4 48,3 40,5 58,2 35,76 45,8 47,2 24,7 28,1 37,27 54,5 44,1 46,1 51,4 58,18 56,6 13,5 35,0 30,4 35,89 31,4 27,3 69,6 55,3 46,5
10 29,3 38,6 33,9 48,7 53,0
iy 41,44 37,21 40,38 40,67 47,23
)(ˆ yVi 95,47 153,17 174,76 142,90 146,78
km
yVff
k
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
211
13 ����
Sendo: m = 10 e k = 5.
hamk
y
y
k
i
i
/386,415
93,206 31
3���
��
131
Amostragem sistemática
tabela 6.5 - Análise de variância estimada por conglomerados.
CV GL SQ QM
Entre 4 531,1892 132,7973
Dentro 45 6417,6910 142,6154
Total 49 6948,8802 141,8139
1
)(
1
)()(ˆ
2
1
1
2
1
2
1 −
−=
−
−=
∑∑∑ =
==
kk
yy
k
yyyV
k
iik
ii
k
ii
23
2
1 )25,0/(27973,134
5
93,2061239,617.8
)(ˆ hamyV �
�
�
Note-se que:
23
1 )25,0/(27973,1310
7973,132ˆ)(ˆ ham
m
MQyV Entre
���
231
2
1
2 )25,0/(616,142)1(
)(
)(ˆ hammk
yy
yV
k
i
i
m
j
ij
��
�
�
��� �
616,142146,78)90,14276,174153,1747,95(5
1)(ˆ
)(ˆ 1
2�������
��
k
yV
yV
n
i
i
Dado:
;50�M ;20�K ;25,020
51
���K
kf 5,0
50
102
���M
mf
132
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Então:
23
3 )25,0/(3485,2510
6154,142)5,01(25,0
5
27973,13)25,01()(ˆ hamyV �
�
����
4) variância da média para as cinco subpopulações com 10 subparcelas (Amostragem por conglomerados)
A população de N = 1.000 foi dividida em K = 20 subpopu-lações de 50 unidades e numeradas de 1 a 20. Foram seleciona-das as subpopulações: 2, 6, 10, 14 e 18 e dentro de cada foram retiradas sistematicamente 10 unidades.
km
yVff
k
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
211
14 ����
tabela 6.6 - Dados considerando cinco subpopulações.
A1 A2 A3 A4 A51 24,5 23,8 40,6 34,0 39,62 17,4 35,4 34,7 29,9 41,03 22,6 46,2 44,3 38,1 49,54 31,5 49,6 32,1 28,9 16,55 50,0 60,3 44,4 28,4 51,46 35,7 18,0 48,0 30,7 36,17 43,9 42,8 33,8 21,8 29,38 41,7 28,8 30,3 26,7 48,79 20,3 40,0 28,4 38,7 42,5
10 47,1 42,0 34,4 54,5 31,4
iy 33,47 38,69 37,10 33,17 38,6
)(ˆ yVi 141,63 158,93 45,23 82,16 115,51
133
Amostragem sistemática
tabela 6.7 - Análise de variância estimada por conglomerados.
CV GL SQ QMEntre 4 294,04 73,531
Dentro 45 4891,25 108,690Total 49 5185,29 105,820
Dado: k = 5 e m = 10.
Da Tabela 6.6, tem-se:
hamkm
y
y
n
i
i
/206,3650
3,1810 31
4 ���
��
1
)(
1
)(
)(ˆ
2
1
1
2
1
2
1�
�
��
�
�
���
�
��
k
k
y
y
k
yy
yV
k
i
ik
i
i
k
i
i
23
2
1)25,0/(3509,7
4
5
03,1817759,583.6
)(ˆ hamyV �
�
�
Observar, considerando as aproximações, que:
23
1)25,0/(3531,7
10
531,73ˆ)(ˆ ham
m
MQyV Entre ���
231
2
1
2 )25,0/(69,108)1(
)(
)(ˆ hammk
yy
yV
k
i
i
m
j
ij
��
�
�
��� �
108,69115,51)82,1645,23158,93141,63(5
1)(ˆ
)(ˆ 1
2 �������
��
k
yV
yV
n
i
i
134
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Dado: 50�M , 20�K
25,020
51 ���
K
kf e 5,0
50
102
���
M
mf . Então:
234 )25,0/(3747,1
510
692,108)5,01(25,0
5
3531,7)25,01()(ˆ hamyV �
�
����
5) variância da média da amostra aleatória de 50 uni-dades
n
yV
N
nNyVAsa
)(ˆ)()(ˆ
4
−=
tabela 6.8 - Dados da amostra aleatória de tamanho n = 50.
28,2 38,5 25,7 23,8 32,7 21,1 41,1 54,5 24,9 24,232,3 22,4 47,6 38,8 26,7 36,9 26,7 36,2 30,9 15,926,7 37,2 21,4 43,0 23,8 38,2 50,5 26,2 27,3 16,645,5 36,3 39,3 30,1 64,2 34,2 61,0 47,6 32,5 46,538,2 38,4 34,8 51,0 37,6 23,4 24,0 30,7 19,3 54,5
Considerando os dados da Tabela 6.8, tem-se:
hamyAsa /582,3450
1,1729 3��
5770,12849
50
1,172901,096.66
1
)(
)(ˆ
2
2
1
1
2
�
�
��
�
�
�� �
�
n
n
y
y
yV
n
i
in
i
i
Portanto:23
4 )/(4430,250
5770,128
1000
501000)(ˆ)()(ˆ ham
n
yV
N
nNyVAsa ��
�
�
�
�
135
Amostragem sistemática
6) discutir e concluir sobre os resultados
tabela 6.9 - Médias e variâncias da média considerando os cinco casos.
Casos Procedimentos Médias Variâncias da média
1 Variâncias conhecidas 38,32 1,5030
2 Análise como ASA 38,32 2,0457
3 Conglomerados 41,39 2,3485
4 Conglomerados (Subpopulações) 36,21 1,3747
5 Amostra aleatória 34,58 2,4430
Este exemplo foi planejado a partir de uma população co-nhecida, para:
hamY 25,0/11,383�
23 )/(7988,137)( hamyV �23
)/(9367,138)( hamyVd �
Sendo a variância da média populacional para a amostra de 50 unidades igual a 1,5030, verifica-se que a análise por con-glomerados apresentou o valor mais próximo (1,3747). A amos-tra aleatória apresentou o maior valor (2,4430), sendo 62,54 % maior que 1,5030. Este resultado é devido existir maior hetero-geneidade entre as unidades dentro das amostras sistemáticas, o que denota uma maior precisão em relação à amostra simples ao acaso, ou seja: )()( yVyVd > .
Conclui-se, neste caso, que o uso da amostragem sistemá-tica é mais recomendável.
cApítulo 7
estImAtIvAs por rAzão
Define a estimativa por razão descrevendo os parâmetros populacionais e os seus estimadores, assim como mostra sua importância na aplicação em inventários florestais apresentan-do casos em que é comum obter a estimativa de uma variável resposta associada a uma variável auxiliar. Apresenta as meto-dologias para obter as estimativas por razão com igual probabi-lidade; com probabilidade proporcional à variável auxiliar; com amostragem inversa com probabilidade proporcional à variável auxiliar. Aborda a estimativa por razão considerando a amostra-gem estratificada. Trata do uso da dupla amostragem com fases dependentes para melhorar a precisão da estimativa. Aborda como comparar dois índices ou duas razões. Mostra vários exer-cícios aplicativos comparando várias alternativas de análise em inventários florestais.
139
Estimativa por razão
Nos levantamentos por amostragem, geralmente, ocorrem casos em que há a necessidade de se obter a estimativa da relação entre duas variáveis aleatórias y e x, normalmente cor-relacionadas para cada unidade de amostra. Pode-se, também, obter a estimativa de uma variável y associada à variável x, po-dendo acontecer que x seja a mesma característica y medida em uma ocasião anterior. O interesse da aplicação da estimativa por razão é obter as informações seguintes:
a) a estimativa da razão R entre as variáveis y e x;b) a estimativa da média por razão ( Ry ), obtida através de
uma variável auxiliar x;c) a estimativa do valor total da população por razão (
RY ), obtida através de uma variável auxiliar x.
O objetivo mais importante do emprego da estimativa por razão é obter maior precisão no cálculo das estimativas dos pa-râmetros utilizando o grau de correlação existente entre y e x, principalmente quando os valores de yi e xi não sofrem grandes variações entre as unidades de amostra, e o tamanho da amos-tra é superior a 30 unidades.
7.1 ESTIMATIVAS POR RAzãO COM IGUAL PROBABILIDADE
a) estimativa da variância de
Para formular os parâmetros e estimadores, utilizar-se-á a seguinte notação:
Y = valor médio populacional da variável de interesse y;y = valor médio amostral da variável de interesse y;Y = valor total populacional da variável de interesse y;Y = valor total amostral da variável de interesse y;X = valor médio populacional da variável auxiliar x;
140
Amostragem em inventário florestal Waldenei Travassos de Queiroz
x = valor médio amostral da variável auxiliar x;X = valor total populacional da variável auxiliar x;X = valor total amostral da variável auxiliar x;
Ry = estimativa da média por razão da variável de interes-se y;
RY = estimativa do valor total da população por razão da variável de interesse y.
Seja a fórmula do valor populacional da razão entre as va-riáveis y e x e do seu estimador, respectivamente:
X
Y
X
YR == ;
y
x
Y
XR ==
ˆ
ˆˆ .
Sob o ponto de vista teórico, o método da estimativa por razão apresenta o inconveniente de que a estimativa R é um quociente entre duas variáveis aleatórias, tornando a sua distri-buição desconhecida e complexa.
Não obstante, Cochran (1977) cita que para pequenas amos-tras a distribuição de R é assimétrica, onde R é uma estimativa tendenciosa de R. Entretanto, para grandes amostras (n >30), a distribuição de R tende à distribuição normal, tornando a ten-dência estatística praticamente desprezível. O ideal é que o va-lor médio populacional X da variável auxiliar seja conhecido.
Seja o desvio RR −ˆ . Então: x
xRyR
x
yRR
−=−=−ˆ .
Considerando para fins aplicativos que Xx = . Então:
X
xRyRR
−≅−ˆ
Queiroz (1998) citou que, geralmente, em inventários de florestas naturais se desconhece o valor médio X populacio-nal da variável auxiliar, sendo mais provável conhecê-lo para florestas plantadas, recomendando, então, para fins aplicativos,
141
Estimativa por razão
tomar xX = para grandes amostras (n >30), desde que não haja heterogeneidade entre os valores dos coeficientes de variação de xX = e Ry (<10%).
Da definição de variância 2)ˆ()ˆ( RRERV −= , portanto:
22
2 )(1
)()ˆ( xRyEXX
xRyERV −=
−≅
Dado que:
dn
d
n
xRy
n
xRyxRy
n
ii
n
iii
n
i
n
iii
==−
=−
=−∑∑∑ ∑
== = 11 1
)(, para iii xRyd −=
Se ,iii xRyd −= logo:
1
)()(
2
1
−
−=∑
=
N
DddV
N
ii
i
Como .0)()( ==−=−= DXRYxRyEdE , então:
1
)(
1)(
2
11
2
−
−=
−=
∑∑==
N
xRy
N
ddV
N
iii
N
ii
i
Se n
dd
n
ii∑
== 1 , então:
1
)(
)()(
)()( 1
2
�
��
��
�
��
N
xRy
Nn
nN
n
dV
N
nNdV
N
i
ii
i
Dado que 2)]([)( dEdEdV −= )]2, mas como:
0)()( =−=−= XRYyRxEdE , tem-se:
142
Amostragem em inventário florestal Waldenei Travassos de Queiroz
22 )()()( xRyEdEdV −==
Dado que ,)(1
)ˆ( 22
xRyEX
RV −≅ então:
1
)(
)()(1
)ˆ( 1
2
22 �
��
��
��
N
xRy
XnN
nNdV
XRV
N
i
ii
Sendo sua estimativa dada por:
1
ˆˆ2
)()ˆ(ˆ 1
22
11
2
2 �
���
�
������
n
xRyxRy
XnN
nNRV
n
i
i
n
i
ii
n
i
i
Esta expressão também pode ser escrita da seguinte forma:
)],(ˆˆ2)(ˆˆ)(ˆ)[()ˆ(ˆ 2
2yxVRxVRyV
XnN
nNRV ��
�
�
Tal que:
;1
)(
)(ˆ
2
1
1
2
�
�
�
��
�
�
n
n
x
x
xV
n
i
in
i
i
;1
)(
)(ˆ
2
1
1
2
�
�
�
��
�
�
n
n
y
y
yV
n
i
in
i
i
1
))((
),(ˆ
11
1
�
�
�
���
��
�
n
n
yx
yx
yxV
n
i
i
n
i
in
i
ii
.
),(ˆ yxV é a covariância entre x e y.
b) intervalo de confiança para a razão (R)
Para o caso de grandes amostras (n > 30) e admitindo-se que R tem distribuição normal, o intervalo de confiança é dado por:
143
Estimativa por razão
)]ˆ(ˆ[2
RstRIC�
�� , onde )ˆ(ˆ)ˆ( RVRs � .
c) estimadores da média, do total e suas variâncias
Conhecida a média populacional X da variável auxiliar é possível, através da estimativa por razão, obter a estimativa do valor total e do valor da média da população para a variável res-posta de interesse y.
Dado quex
y
X
YR ==
ˆ
ˆˆ , então XRyR
ˆ= e ).ˆ(ˆ)(ˆ 2 RVXyV R = ).
Assim como:
XNRXRYRˆˆˆ == e )ˆ(ˆ)ˆ(ˆ 22 RVXNYV R =
d) intervalo de confiança para a média Y e para o valor total Y
Considerando grandes amostras (n > 30) e admitindo-se que R tem distribuição normal, têm-se:
)]ˆ(ˆ[)(22
RstRXystyIC RR ������
)]ˆ(ˆ[)]([)ˆ(ˆ
222
RstRXNystyNYstYIC RRRR ���������
exercício 7.1
Seja o inventário florestal de uma área de 3.574,00 ha per-tencente à Fazenda Santa Lúcia, localizada no município de Pau D’arco, estado do Pará, realizado por Borges (1990) e analisado
144
Amostragem em inventário florestal Waldenei Travassos de Queiroz
por Queiroz (1998). Os dados foram obtidos através da medição de 30 unidades de uma amostra simples ao acaso e mostrados na Tabela 7.1. A estrutura da unidade de amostra apresentou uma forma retangular de 10 m de largura e 250 m de comprimento, onde foram mensuradas todas as árvores com 45≥DAP 45 cm. Ana-lisar os dados através da amostragem por razão com igual proba-bilidade (AIP).
tabela 7.1 - Estimativa por razão com igual probabilidade (AIP).
UA xi yi UA xi yi UA xi yi
1 6 13,0 11 5 16,5 21 10 30,52 4 16,1 12 4 17,1 22 7 14,73 4 9,7 13 6 17,6 23 8 19,04 5 20,1 14 9 24,0 24 6 19,75 9 29,6 15 5 16,7 25 6 18,46 8 23,4 16 5 21,9 26 8 25,47 5 21,9 17 3 10,4 27 8 18,68 4 17,5 18 5 10,0 28 6 18,99 8 22,1 19 4 14,5 29 9 28,3
10 5 12,8 20 7 29,7 30 7 22,0
a) informações iniciais sobre volume e número de árvores na amostra
yi = volume em m3/0,25 haxi = número de árvores/0,25 ha
��
�30
1
10,580i
iy m3; �
�
�30
1
186i
ix árvores
a1) valor médio para a variável auxiliar número de árvores
haárvores
x
xi
i
25,0/2,630
186
30
30
1���
��
145
Estimativa por razão
a2) valor médio para a variável de interesse (volume)
ham
y
y i
i
25,0/3367,1930
10,580
30
3
30
1 ���
��
Portanto:hamy /3467,77
3�
b) estimativa da razão
árvoremx
yR /1188,3
186
10,580ˆ 3���
c) cálculo da estimativa da variância de RDado que:N = 3574 / 0,25 = 14.296
6748,3229
30
10,58077,164.12
1
)(
)(ˆ
2
2
1
1
2
�
�
��
�
�
��
�
�
n
n
y
y
yV
n
i
in
i
i
4759,329
30
1860,254.1
1
)(
)(ˆ
2
2
1
1
2
�
�
��
�
�
��
�
�
n
n
x
x
xV
n
i
in
i
i
0752,829
30
10,5801868,830.3
1
))((
),(ˆ
11
1�
��
��
�
�
��� ��
�
n
n
yx
yx
yxV
n
i
i
n
i
in
i
ii
Então:
)],(ˆˆ2)(ˆˆ)(ˆ)[()ˆ(ˆ 2
2yxVRxVRyV
XnN
nNRV ��
�
�
)0752,81188,324759,31188,36748,32)(2,6296.1430
30296.14()( 2
2�����
��
��
��
RV
23 )/(01394458,0)( árvoremRV �
��
146
Amostragem em inventário florestal Waldenei Travassos de Queiroz)],(ˆˆ2)(ˆˆ)(ˆ)[()ˆ(ˆ 2
2yxVRxVRyV
XnN
nNRV ��
�
�
)0752,81188,324759,31188,36748,32)(2,6296.1430
30296.14()( 2
2�����
��
��
��
RV
23 )/(01394458,0)( árvoremRV �
��
Considerando o desconhecimento do valor populacional
do número de árvores X , utilizou-se haárvoresxX 25,0/2,6== 0,25 ha.
d) estimativa do erro padrão de R
árvoremRVRs /1181,0013944584,0)ˆ(ˆ)ˆ( 3===
e) intervalo de confiança para R
Seja “t = 2,0452” o valor da distribuição de “Student” com 29 graus de liberdade para o nível de significância a=0,05. Então:
Limite inferiorárvoremRstR /8773,21181,00452,21188,3)ˆ(ˆ 3=×−=×−
Limite superiorárvoremRstR /3603,31181,00452,21188,3)ˆ(ˆ 3=×+=×+
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor verdadeiro ou paramétrico da razão encontra-se no intervalo de 2,8773 a 3,3603.
f) estimativa da média do volume Ry e sua variância )(ˆRyV
hamXRy R 25,0/34,192,61188,3ˆ 3���� , tal que: hamyR /35,77 3
�
2322)25,0/(536029655,001394458,02,6)ˆ(ˆ)(ˆ hamRVXyV R ����
232 )/(576474,85014,04)(ˆ hamyVR
���
147
Estimativa por razão
Adotou-se:
haárvoresxX /2,630
186 ���
g) erro padrão da média
hamhayVys RR /928562,2/)(ˆ)(3��
h) estimativas do total RY e sua variância )ˆ(ˆRYV
34618,435.2762,614.2961188,3ˆˆ mXNRY
R�����
232222)(0,391.551.10901394458,02,6296.14)ˆ(ˆ)ˆ(ˆ mRVXNYV
R�����
i) erro padrão do total368,466.10)ˆ(ˆ)ˆ( mYVYs
RR��
j) intervalo de confiança para o valor médio Y
Limite inferior/hahamysty
RR/36,71928562,20452,235,77)(
3������
Limite superior/hahamysty
RR/34,83928562,20452,235,77)(
3������
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 71,36 m3/ ha a 83,34 m3/ ha.
k) intervalo de confiança para o valor total Y
Limite inferior 301,029.25568,466.100452,246,435.276)ˆ(ˆ mYstY
RR������
148
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Limite superior 3
91,841.29768,466.100452,246,435.276)ˆ(ˆ mYstYRR
������
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 255.029,01 m3/ ha a 297.841,91 m3/ ha.
l) limite de erro para a estimativa por razão
%74,710035,77
928562,20452,2100
)(��
�
��
�
�
R
R
Ry
ystLE
m) cálculo da variância da média sem considerar a variável auxiliar (número de árvores)
23)25,0/(0869,1)
296.14
30296.14(
30
6748,32)(
)(ˆ)(ˆ ham
N
nN
n
yVyV �
�
�
�
�
23)/(39,17)(ˆ hamyV �
hamhayVhays /1701,439,17/)(ˆ/)(3
���
n) limite de erro sem considerar a variável auxiliar (número de árvores)
%03,1110035,77
1701,40452,2100
)(��
�
���
y
ystLE
SV
o) estimativa da eficiência da estimativa por razão Considerando a definição de eficiência como o quociente
entre o limite de erro sem considerar a variável auxiliar número de árvores e o limite de erro estimado pelo método da razão, tem-se:
46,1 42%74,7
%03,11 ���R
SV
LE
LEEf
149
Estimativa por razão
Os resultados mostram um limite de erro de 11,03 %, não considerando na análise a variável auxiliar número de árvores por parcela. Este limite de erro corresponde a um valor 42,46 % maior que o estimado pelo método por razão (7,74 %), demons-trando que esta estimativa apresenta uma eficiência superior àquela.
Dado que:
7.2 ESTIMATIVAS POR RAzãO CONSIDERANDO PROBABI-LIDADE PROPORCIONAL (AAP) À VARIáVEL AUxILIAR (x)
Considera-se na seleção de uma amostra, normalmente, que todos os elementos da população sejam igualmente prová-veis de serem escolhidos. Na estimativa por razão, em alguns casos, é usual selecionar a amostra com probabilidade propor-cional aos valores da variável auxiliar x. Neste método, o peso de cada elemento é considerado na seleção, visto que a ocor-rência dos mesmos não é igualmente provável.
Este procedimento produz estimativas não tendenciosas para média, valor total e suas respectivas variâncias. Não há correção para população finita por tratar-se de uma amostragem com reposição.
Seja n
RR
n
ii∑
== 1ˆ o estimador não tendencioso de .1
N
RR
N
Ii∑
==
Convém salientar que a razão média R , que é uma média ponderada dos iii xyR = , difere da média das razões .R Ou seja:
)()( yLEyLE SVR � , ou seja,4246,1
)()(
yLEyLE SV
R�
150
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Rx
RxR
n
ii
N
Iii
ˆˆ
1
1 ≠=
∑
∑
=
=
Dado que 1
)(
1
)ˆ()(ˆ 1
2
122
1
−
−=
−
−=
∑∑
∑=
=
=
nn
RR
n
RRRV
n
i
n
ii
i
n
Ii
i. Então:
n
RVRV i )(ˆ
)ˆ(ˆ =
A partir da estimativa n
RR
n
ii∑
== 1ˆ , pode-se obter:
;RXyR = XRNyNY RRˆˆ == e suas respectivas variâncias:
);ˆ(ˆ)(ˆ 2 RVXyV R = )ˆ(ˆ)(ˆ)ˆ(ˆ 222 RVXNyVNYV R ==
exercício 7.2
Seja uma área florestal populacional de 100 ha com ocor-rências de 405 árvores matrizes. O objetivo é monitorar a produ-ção de sementes de uma determinada espécie florestal. A área está subdividida em 100 subáreas (Unid) de 1 ha. As 405 matri-zes da espécie em estudo estão perfeitamente localizadas em um mapa logístico. A Tabela 7.2 apresenta os dados: número de árvores por unidade de 1 ha (x) e a numeração sequencial para as 405 árvores. A Tabela 7.3 apresenta os dados sobre a produção de semente em kg por Unid para uma amostra de 50 árvores. Analisar os dados através da amostragem com Proba-bilidade Proporcional à x (APP).
151
Estimativa por razão
tabela 7.2 - Número de árvores para as 100 unidades de 1 ha (Unid).
Unid x Num Unid x Num Unid x Num
1 4 1 a 4 34 2 133 a 134 67 4 267 a 270
2 4 5 a 8 35 3 135 a 137 68 5 271 a 275
3 3 9 a 11 36 4 138 a 141 69 4 276 a 279
4 3 12 a 14 37 4 142 a 145 70 3 280 a 282
5 7 15 a 21 38 4 146 a 149 71 6 283 a 288
6 5 22 a 26 39 7 150 a 156 72 5 289 a 293
7 3 27 a 29 40 4 157 a 160 73 2 294 a 295
8 4 30 a 33 41 3 161 a 163 74 5 296 a 300
9 3 34 a 36 42 4 164 a 167 75 3 301 a 303
10 4 37 a 40 43 5 168 a 172 76 4 304 a 307
11 4 41 a 44 44 4 173 a 176 77 4 308 a 311
12 3 45 a 47 45 7 177 a 183 78 5 312 a 316
13 5 48 a 52 46 4 184 a 187 79 2 317 a 318
14 6 53 a 58 47 4 188 a 191 80 4 319 a 322
15 2 59 a 60 48 3 192 a 194 81 3 323 a 325
16 5 61 a 65 49 2 195 a 196 82 3 326 a 328
17 4 66 a 69 50 3 197 a 199 83 5 329 a 333
18 4 70 a 73 51 4 200 a 203 84 5 334 a 338
19 5 74 a 78 52 5 204 a 208 85 5 339 a 343
20 3 79 a 81 53 4 209 a 212 86 3 344 a 346
21 4 82 a 85 54 5 213 a 217 87 3 347 a 349
22 4 86 a 89 55 4 218 a 221 88 4 350 a 353
23 3 90 a 92 56 4 222 a 225 89 4 354 a 357
24 5 93 a 97 57 5 226 a 230 90 6 358 a 363
25 3 98 a 100 58 6 231 a 236 91 6 364 a 369
26 5 101 a 105 59 4 237 a 240 92 2 370 a 371
27 4 106 a 09 60 3 241 a 243 93 7 372 a 378
28 4 110 a 113 61 1 244 94 2 379 a 380
29 3 114 a 116 62 6 245 a 250 95 5 381 a 385
30 4 117 a 120 63 5 251 a 255 96 3 386 a 388
31 4 212 a 124 64 4 256 a 259 97 4 389 a 392
32 5 125 a 129 65 4 260 a 263 98 6 393 a 398
33 3 130 a 132 66 3 264 a 266 99 3 399 a 401
100 4 402 a 405
152
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 7.3 - Produção em kg de sementes (yi) por Unid amostrada.
Árvore Unid xi yi i
ii x
yR = Árvore Unid xi yi i
ii x
yR =
24 6 5 16,15 3,23000 254 63 5 12,20 2,4400036 9 3 10,53 3,51000 261 65 4 12,58 3,1450037 10 4 8,50 2,12500 262 65 4 12,58 3,1450039 10 4 8,50 2,12500 276 69 4 13,13 3,2825049 13 5 11,90 2,38000 278 69 4 13,13 3,2825091 23 3 9,07 3,02333 279 69 4 13,13 3,28250111 28 4 13,23 3,30750 285 71 6 14,39 2,39833120 30 4 11,48 2,87000 288 71 6 14,39 2,39833127 32 5 14,71 2,94200 291 72 5 14,58 2,91600128 32 5 14,71 2,94200 293 72 5 14,58 2,91600136 35 3 10,95 3,65000 297 74 5 14,14 2,82800138 36 4 15,31 3,82750 303 75 3 11,94 3,98000144 37 4 11,26 2,81500 312 78 5 12,37 2,47400148 38 4 11,73 2,93250 323 81 3 11,03 3,67667153 39 7 16,42 2,34571 325 81 3 11,03 3,67667165 42 4 12,57 3,14250 334 84 5 12,71 2,54200175 44 4 10,88 2,72000 336 84 5 12,71 2,54200189 47 4 13,03 3,25750 349 87 3 8,93 2,97667199 50 3 11,11 3,70333 362 90 6 15,75 2,62500200 51 4 10,28 2,57000 371 92 2 10,71 5,35500203 51 4 10,28 2,57000 372 93 7 15,01 2,14429208 52 5 13,14 2,62800 376 93 7 15,01 2,14429229 57 5 13,44 2,68800 394 98 6 13,76 2,29333233 58 6 14,14 2,35667 398 98 6 13,76 2,29333240 59 4 15,40 3,85000 400 99 3 8,19 2,73000Total 223 630,46 146,9990
a) média das razões ( R )
árvorekgn
R
R
n
i
i
/94,250
9990,146ˆ 1���
��
153
Estimativa por razão
b) variância de R
2
2
1
2
12
)/(3735,049
50
999,1464753,450
1
)(
)(ˆ árvorekgn
n
R
R
RV
n
i
n
i
i
i
i �
�
��
�
�
��
�
�
2)/(00746987,050
3735,0)(ˆ)
ˆ(ˆ árvorekg
n
RVRV i ���
c) intervalo de confiança para N
RR
N
Ii∑
== 1
árvorekgRVRs /0864,0)ˆ
(ˆ)ˆ
( ��
0864,001,294,2)ˆ
(ˆ
����� RstRIC
árvorekgRárvorekg /1137,3/7663,2 ��
Pode-se afirmar, com uma probabilidade de acerto de 95%, que a razão populacional (R) encontra-se no intervalo de 2,7663 kg/árvore a 3,1137 kg/árvore.
d) valor médio para a produção de semente por hahakgRXy
RAPP/907,1194,205,4 ����
Sendo:
árvoresN
x
X
N
i
i
05,4100
4051 ���
��
e) variância do valor médio para a produção de semente por ha
222)/(12252454,000746987,005,4)(ˆ)(ˆ hakgRVXyV
RAPP����
154
Amostragem em inventário florestal Waldenei Travassos de Queiroz
f) intervalo de confiança para o valor médio para a produ-ção de sementes
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional de produção de sementes en-contra-se no intervalo de 11,2035 kg / ha a 12,6111 kg / ha.
g) estimativa para o total da produção total de sementes
h) variância para o valor total da produção total de sementes
i) intervalo de confiança para o valor total da produção total de sementes
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional de produção de sementes encon-tra-se no intervalo de 1.120,35 kg a 1.261,05 kg.
hakgyVys RAPPRAPP /3500,01225,0)(ˆ)( ���
3500,001,2907,11)( �����RAPPRAPP
ystyIC
hakgYhakg /6105,12/2035,11 ��
kgRXNyNY RAPPRAPP 7,190.194,205,4100ˆ������
00746987,005,4100)()(ˆ)ˆ(ˆ 22222�����
RAPPRAPPyVNRVXNYV
22339,225.1)ˆ(ˆ kgYV RAPP �
kgYVYs RAPPRAPP 00,352339,225.1)ˆ(ˆ)ˆ( ���
3501,27,190.1)ˆ(ˆ ����� RAPPRAPP YstYIC
kgYkg 05,261.135,120.1 ��
155
Estimativa por razão
j) discussão e conclusão
Verifica-se, através da Tabela 7.3, que as 50 árvores sor-teadas estão inseridas em 38 unidades (Unid), o que significa redução nos deslocamentos e diminuição nos custos do levan-tamento.
A amostra estudada de 38 Unid (50 árvores) foi retirada de uma população simulada com vetor de médias vY e matriz de covariâncias .∑
Resultando a matriz de correlações correspondente (Corr)
=
17094,0
7094,01orrC
Considerando a amostra de 50 árvores, sejam os resulta-dos amostrais para o vetor de médias, matrizes de covariâncias e de correlações:
Verifica-se que o valor médio verdadeiro 081,12=Y 12,081 está contido no intervalo de confiança (11,2035 kg/ha )./6105,12/2035,11( hakgYhakg ≤≤ 12,6105 kg/ha).
156
Amostragem em inventário florestal Waldenei Travassos de Queiroz
7.3 ESTIMATIVAS POR RAzãO: AMOSTRAGEM INVERSA COM PROBABILIDADE PROPORCIONAL À VARIáVEL AUxI-LIAR x (AIPP).
O processo da estimativa por razão com amostragem in-versa com probabilidade proporcional à variável auxiliar x é uma variação metodológica da estimativa por razão com probabilida-de proporcional à variável auxiliar (AAP).
No processo da estimativa por razão com probabilidade proporcional à variável auxiliar (AAP) quando o tamanho da amostra n é relativamente grande em relação ao tamanho da população N, na seleção da amostra, pode não ocorrer n unida-des distintas. No exercício 7.2, tal que N = 100, verificou-se 38 unidades distintas para 50 árvores. Obviamente, a repetição de unidades na amostra diminuirá o custo do levantamento.
Entretanto, para o caso de n ser relativamente grande em relação a N, pode-se, dentro dessa concepção estrutural, sortear tantas unidades necessárias, até atingir n+1 unidades distintas. A amostra será constituída pelas n unidades distintas, despre-zando-se a última unidade sorteada. Este processo é denomi-nado de Amostragem Inversa com Probabilidade Proporcional à variável auxiliar x (AIPP).
No exemplo aplicativo anterior, supondo que o desejo do planejador é ter n = 40, então seria necessário continuar o sor-teio até conseguir mais três unidades distintas das 38 já sortea-das. A última seria descartada.
Estabelecidas as n unidades distintas, a análise estatística da AIPP será análoga à APP, já abordada anteriormente.
157
Estimativa por razão
7.4 ESTIMATIVAS POR RAzãO CONSIDERANDO A AMOS-TRAGEM ESTRATIFICADA
Na amostragem estratificada, considerando que os estra-tos são independentes, existem dois procedimentos distintos para estimar a média e o valor total através da estimativa por razão.
1) Efetuar as estimativas dentro de cada estrato.2) Efetuar a estimativa considerando todos os estratos glo-
balmente.
1) efetuar as estimativas dentro de cada estrato
Seja L o número de estratos, então:
h
hh x
yR =ˆ , onde Lh ,,1 L= .
Sejam as estimativas do valor médio e do total:
Sendo:
Consequentemente:
hhRh RXy ˆ� e hhhhhRhhRh RXRXNyNY ˆˆˆ ���
hhhXNX �
��
�
L
h
Rhhst yWy1
Re
� ��� ��
����L
h
L
h
hhhh
L
h
h
h
stst YRXRXN
NNyNY
1 11
ReReˆˆˆˆ
158
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Considerando que a amostra dentro de cada estrato seja relativamente grande, tem-se:
Tal que:
Assim como:
Daí, como os estratos são independentes:
2) efetuar a estimativa considerando todos os estratos globalmente
Dado que:
;1∑
=
=L
hhhest yWy ∑
=
=L
hhhest xWx
1
Determina-se a “razão combinada ou índice combinado” que é o quociente entre a média estratificada da variável res-posta de interesse y e média estratificada da variável resposta auxiliar x (covariável):
est
estC x
yR =ˆ
Resultando:
1
ˆˆ2
)()ˆ(ˆ 1 1
22
1
2
2 �
���
�
� ��� ��
h
n
i
n
i
hihhihih
n
i
hi
hhh
hh
hn
xRyxRy
XNn
nNRV
h hh
)ˆ(ˆ)(ˆ 2
hhRh RVXyV � e )(ˆ)(ˆ
1
2
Re Rh
L
hhst yVWyV �
�
�
)(ˆ)ˆ(ˆ 2
RhhRh yVNYV �
.)ˆ(ˆ)ˆ(ˆ
1
��
�L
h
RhRYVYV
RCRC RXy ˆ�
159
Estimativa por razão
Para grandes amostras, tem-se:
1
ˆˆ2
)()ˆ(ˆ 1 1
22
1
2
12 �
���
�
� ���
� ��
� h
n
i
n
i
hiRChihiRC
n
i
hiL
h hhh
hh
RCn
xRyxRy
XNn
nNRV
h hh
Sendo: )ˆ(ˆ)(ˆ 2
RCRCRVXyV �
;ˆˆˆCCRC RXRXNY �� XNX �
)ˆ(ˆ)ˆ(ˆ 2
RCRC RVXYV �
exercício 7.3
Seja uma área florestal de 10.000 ha, onde, através de téc-nicas de interpretação de imagens fotográficas, foram detecta-dos três estratos, a saber:
Estrato I (floresta alta sem babaçu) = 2.000 ha;Estrato II (floresta alta com babaçu) = 5.000 ha;Estrato III (floresta baixa cipoálica) = 3.000 ha.
Através da amostra simples ao acaso, foram selecionadas nos estratos as seguintes quantidades de unidades de amostra:
1n = 13; 2n = 15 e 3n = 11.
A estrutura da unidade amostral apresentou uma forma retangular de 10 m de largura e 250 m de comprimento, onde foram mensuradas todas as árvores com DAP 45 cm. A Tabela 7.4 apresenta os dados (simulados) por estrato para os volumes e número de árvores por parcela de 0,25 ha.
Analisar os dados considerando: 1) as estimativas dentro de cada estrato;
160
Amostragem em inventário florestal Waldenei Travassos de Queiroz
2) as estimativas considerando todos os estratos global-mente;
3) estimativas desconsiderando a variável auxiliar x (nú-mero de árvores);
4) discutir e concluir sobre os resultados.
tabela 7.4 - Amostra estratificada por razão: m3 / 0,25 ha.
EST I EST II EST III
y x y x y x
21,10 8 12,90 5 8,10 3
34,00 15 17,00 6 12,00 3
18,00 8 9,50 4 9,50 4
20,00 8 20,00 5 14,50 5
55,00 22 30,10 11 18,17 6
23,42 9 23,42 6 21,10 7
40,50 15 21,10 8 10,80 3
17,44 8 17,44 6 7,50 3
22,12 10 22,12 8 6,50 2
25,00 10 12,00 4 12,50 4
31,20 13 16,50 6 5,20 2
17,05 6 17,05 6
24,10 9 24,10 9
16,71 6
21,80 7
1) efetuar as estimativas dentro de cada estrato
a) informações gerais sobre os dados
2,0000.10
000.21
��ha
haW ; 5,0
000.10
000.52
��ha
haW ; ;3,0
000.10
000.33
��ha
haW
161
Estimativa por razão
000.825,0
000.21
��ha
haN ; 000.20
25,0
000.52 ��
haN ; ;000.12
25,0
000.33 ��
ha
haN
hamn
y
y
n
i
i
25,0/8408,2613
93,348 3
1
1
1
1
1
���
��
hamn
y
y
n
i
i
25,0/7827,1815
74,281 3
2
1
2
2
2
���
��
hamn
y
y
n
i
i
25,0/4427,1111
87,125 3
3
1
3
3
3
���
��
haárvoresn
x
x
n
i
i
25,0/8462,1013
141
1
1
1
1
1
���
��
haárvoresn
x
x
n
i
i
25,0/4667,615
97
2
1
2
2
2
���
��
haárvoresn
x
x
n
i
i
25,0/8182,311
42
3
1
3
3
3
���
��
b) estimativa da razão R por estrato
4747,28462,10
8408,26ˆ
1
1
1���
x
yR
9045,24667,6
7827,18ˆ
2
2
2���
x
yR
9969,28182,3
4427,11ˆ
3
3
3���
x
yR
162
Amostragem em inventário florestal Waldenei Travassos de Queiroz
c) estimativas para os valores médios por razão por estrato
Devido ao desconhecimento dos valores populacionais, considerou-se: ;11 Xx = ;22 Xx = 33 Xx = .
d) estimativas para os valores totais por razão por estrato
e) média estratificada por razão
f) variância dos hR
Considerando: ;11 xX = ;22 xX = 33 xX = , têm-se:
hamRXyR 25,0/8411,264747,28462,10ˆ 3
111����
hamRXyR 25,0/7825,189045,24667,6ˆ 3
222����
hamRXyR 25,0/4428,119969,28182,3ˆ 3
333����
3
11173,728.214841091,26000.8ˆ myNY
RR����
3
22260,650.375782530,18000.20ˆ myNY
RR����
3
33316,313.137442764,11000.12ˆ myNY
RR����
��
�L
h
Rhh yWy1
Rest
hamy 25,0/1923,18442764,113,0782530,185,0841091,262,0 3Rest �������
3
RestRest48,692.727192312,18000.40ˆ myNY ����
1
ˆˆ2
)()ˆ(ˆ
1
1 1
2
1
2
1111
1
2
1
2
111
11
1
1 11
�
���
�
� ��� ��
n
xRyxRy
XNn
nNRV
n
i
n
i
iii
n
i
i
163
Estimativa por razão
g) variância da média por estrato
h) variância da média estratificada
i) limite de erro (LEDest) considerando as estimativas dentro de cada estrato
12
17574747,26,43464747,2236,802.10)
8462,10000.813
13000.8()ˆ(ˆ
2
21
�����
��
��RV
710026881108,0)ˆ(ˆ1 �RV
1
ˆˆ2
)()ˆ(ˆ
2
1 1
2
2
2
2222
1
2
2
2
222
22
2
2 22
�
���
�
� ��� ��
n
xRyxRy
XNn
nNRV
n
i
n
i
iii
n
i
i
14
6779045,26,945.19045,2205,681.5)
4667,6000.2015
15000.20()ˆ(ˆ
2
22
�����
��
��RV
01027637,0)ˆ(ˆ2
�RV
1
ˆˆ2
)()ˆ(ˆ
3
1 1
23
23333
1
23
2
333
333
3 33
�
���
�
� ��� ��
n
xRyxRy
XNn
nNRV
n
i
n
i
iii
n
i
i
10
1869969,28,5559969,2290,683.1)
8182,3000.1211
11000.12()ˆ(ˆ
2
23
�����
��
��RV
014384036,0)ˆ(ˆ3
�RV
232
1
2
11)25,0/(316229509,0710026881108,08462,10)ˆ(ˆ)(ˆ hamRVXyV R ����
232
2
2
22)25,0/(429739402,001027637,04667,6)ˆ(ˆ)(ˆ hamRVXyV R ����
232
3
2
33)25,0/(209699848,0014384036,08182,3)ˆ(ˆ)(ˆ hamRVXyV R ����
)(ˆ)(ˆ
1
2
Rest Rh
L
h
h yVWyV ��
�
209699844,03,0429739402,05,0316229509,02,0)(ˆ 222
Rest������yV
23
Rest )25,0/(138957016,0)(ˆ hamyV �
164
Amostragem em inventário florestal Waldenei Travassos de Queiroz
j) variância do total por estrato
k) estimativa da variância do total da população
2) efetuar a estimativa considerando todos os estratos globalmente
a) informações gerais sobre os dados
%16,4192312,18
13895701,00296,2)(
Re
R e�
�
�
�
�
st
st
Des ty
ystLE
32
1
2
1158,688.238.20316229509,0000.8)(ˆ)ˆ(ˆ myVNYV
RR����
32
2
2
22 8,760.895.171429739402,0000.20)(ˆ)ˆ(ˆ myVNYV RR ����
32
3
2
33 11,778.196.30209699848,0000.12)(ˆ)ˆ(ˆ myVNYV RR ����
11,778.196.308,760.895.17158,688.238.20)ˆ(ˆ)ˆ(ˆ
1
���� ��
L
h
RhR YVYV
3
1
5,227.331.222)ˆ(ˆ)ˆ(ˆ mYVYV
L
h
RhR�� �
�
165
Estimativa por razão
b) estimativa da razão CR
Considerando:
Tem-se:
c) estimativa do valor médio
d) cálculo da estimativa da variância
Dado que:
Então:
haárvoresxXest
25,0/54805,6��
778281,254805,6
19232,18ˆ ���est
es t
Cx
yR
RCy
hamRXy RCRC 25,0/192323,18778281,254805,6ˆ 3����
1
ˆˆ2
)()ˆ(ˆ 1 1
22
1
2
12 �
���
�
� ���
� ��
� h
n
i
n
i
hiRChihiRC
n
i
hiL
h hh
hh
RCn
xRyxRy
XNn
nNRV
h hh
1
ˆˆ2
)()ˆ(ˆ 1 1
22
1
2
12 �
���
�
� ���
� ��
� h
n
i
n
i
hiRChihiRC
n
i
hiL
h hh
hh
RCn
xRyxRy
XNn
nNRV
h hh
321)ˆ(ˆ VVVRV RC ���
1
ˆˆ2
)(1
1 1
2
1
2
11
1
2
1
2
11
111
1 11
�
���
�
� ��� ��
n
xRyxRy
XNn
nNV
n
i
n
i
iRCiiRC
n
i
i
12
757.1778281,26,346.4778281,2236,802.10)
54805,6000.813
)13000.8((
2
21
�����
��
��V
031675905,01
�V
1
ˆˆ2
)(2
1 1
2
2
2
22
1
2
2
2
222
22
2
2 22
�
���
�
� ��� ��
n
xRyxRy
XNn
nNV
n
i
n
i
iRCiiRC
n
i
i
14
677778281,26,945.1778281,2205,681.5
54805,6000.2015
15000.202
22
������
��
��V
010638342,02 �V
1
ˆˆ2
)(3
1 1
2
3
2
33
1
2
3
2
333
333
3 33
�
���
�
� ��� ��
n
xRyxRy
XNn
nNV
n
i
n
i
iRCiiRC
n
i
i
10
186778281,28,555778281,2290,683.1
54805,6000.1211
11000.122
23
������
��
��V
790066234782,03 �V
166
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Finalmente:
e) cálculo da estimativa da variância
f) cálculo da estimativa do valor total
g) cálculo da variância do valor total
h) limite de erro (LERC) considerando todos os estratos glo-balmente
1
ˆˆ2
)(1
1 1
2
1
2
11
1
2
1
2
11
111
1 11
�
���
�
� ��� ��
n
xRyxRy
XNn
nNV
n
i
n
i
iRCiiRC
n
i
i
12
757.1778281,26,346.4778281,2236,802.10)
54805,6000.813
)13000.8((
2
21
�����
��
��V
031675905,01
�V
1
ˆˆ2
)(2
1 1
2
2
2
22
1
2
2
2
222
22
2
2 22
�
���
�
� ��� ��
n
xRyxRy
XNn
nNV
n
i
n
i
iRCiiRC
n
i
i
14
677778281,26,945.1778281,2205,681.5
54805,6000.2015
15000.202
22
������
��
��V
010638342,02 �V
1
ˆˆ2
)(3
1 1
2
3
2
33
1
2
3
2
333
333
3 33
�
���
�
� ��� ��
n
xRyxRy
XNn
nNV
n
i
n
i
iRCiiRC
n
i
i
10
186778281,28,555778281,2290,683.1
54805,6000.1211
11000.122
23
������
��
��V
790066234782,03 �V
321)ˆ(ˆ VVVRV RC ���
048937725,0790066234782,0010638342,0031675905,0)ˆ(ˆ����RCRV
2322)25,0/(098300819,2048937725,054805,6)ˆ(ˆ)(ˆ hamRVXyV
RCRC����
2322)25,0/(098300819,2048937725,054805,6)ˆ(ˆ)(ˆ hamRVXyV
RCRC����
39161,692.727778281,254805,6000.40ˆˆ mRXNY
CRC�����
árvoresxNXest
0,922.26154805,6000.40 ����
39161,692.727778281,254805,6000.40ˆˆ mRXNY
CRC�����
árvoresxNXest
0,922.26154805,6000.40 ����
0,310.281.357.3048937725,0922.261)ˆ(ˆ)ˆ(ˆ 22���� RCRC RVXYV
0,310.281.357.3048937725,0922.261)ˆ(ˆ)ˆ(ˆ 22���� RCRC RVXYV
%16,16192312,18
09830081,20296,2)(
Re
Re�
�
�
�
�
st
st
RCy
ystLE
167
Estimativa por razão
3) estimativas desconsiderando a variável auxiliar x (número de árvores). Análise convencional (metodologia da AsA)
Objetivando promover comparações em termos de preci-são, obter as estimativas desconsiderando a variável auxiliar x (número de árvores).
a) média estratificada da variável de interesse
b) variância da média estratificada da variável de interesse
Pois:
c) limite de erro (LESV) desconsiderando a variável auxiliar x (número de árvores)
4427,11000.40
000.127827,18
000.40
000.208408,26
000.40
000.8
1
���������
L
h
hhes tyWy
hamyest 25,0/19232,18 3�
1555915,4540000
10310813,1
)(ˆ)(ˆ)(ˆ
11
2
����� ����
L
h
hh
L
h h
hhest
N
yVW
n
yVWyV
23 )25,0/(0299524,1)(ˆ hamyV est �
0310813,1)(ˆ
1
2
��
�L
h h
hh
n
yVW
1555915,45)(ˆ
1
���
L
h
hhyVW
%32,1119232,18
0299524,10296,2)(�
�
�
�
�
est
estSV
y
ystLE
168
Amostragem em inventário florestal Waldenei Travassos de Queiroz
4) discutir e concluir sobre os resultados
Na Tabela 7.5 estão os resultados a partir das análises re-alizadas.
tabela 7.5 - Resultados das análises da amostra estratificada.
Método Média (m3/0,25 ha)
Variância da média(m3/0,25 ha) LE %
Convencional (ASA) 18,192320 1,029952400 11,32
Razão (estratos) 18,192312 0,138957016 4,16
Razão (combinada) 18,192323 2,098300810 16,16
Usando a definição de eficiência como o quociente entre o limite de erro sem considerar a variável auxiliar número de árvo-res e o limite de erro estimado pelo método da razão dentro de cada estrato, tem-se:
A partir da definição de eficiência como o quociente entre o limite de erro estimado pelo método da razão, considerando todos os estratos globalmente, e o limite de erro sem usar a va-riável auxiliar número de árvores, resulta:
Dada a definição de eficiência como o quociente entre o limite de erro pelo método da razão analisando os estratos de forma global e o limite de erro estimado pelo método da razão considerando os estratos separadamente, tem-se:
7212,2%16,4
%32,11 ���Dest
SV
LE
LEEf
4276,1%32,11
%16,16 ���SV
RC
LE
LEEf
169
Estimativa por razão
Os resultados mostram um limite de erro de 11,32% não usando na análise a variável auxiliar número de árvores por par-cela. Este limite de erro corresponde a um valor 172,12% maior que o estimado pelo método por razão com as estimativas den-tro de cada estrato (4,16%). Conclui-se que esta estimativa (ra-zão) é mais eficiente.
Dado que:
Os resultados mostram um limite de erro de 16,16% pelo método por razão a partir das estimativas para todos os estratos globalmente. Este limite de erro corresponde a um valor 42,76 % maior que o limite de erro estimado pelo método quando não considerado na análise a variável auxiliar número de árvores (4,16 %), demonstrando que este método apresenta uma efici-ência superior àquele.
Dado que:
Os resultados apresentam um limite de erro de 16,16% pelo método por razão considerando as estimativas para todos os estratos globalmente. Este limite de erro corresponde a um valor 288,46% maior que o limite de erro estimado pelo método por razão quando as estimativas forem obtidas dentro de cada estrato (4,16%), demonstrando que o método de análise por ra-zão a partir das estimativas dentro de cada estrato apresenta
8846,316,4
16,16 ���Dest
S V
LE
LEEf
SVDe stLELE � , ou seja,
7212,2
SV
Dest
LELE �
RCSVLELE � , ou seja,
4276,1
RC
SV
LELE �
170
Amostragem em inventário florestal Waldenei Travassos de Queiroz
uma eficiência superior ao método por razão usando as estima-tivas para todos os estratos globalmente.
Dado que:
7.5 DUPLA AMOSTRAGEM: FASES DEPENDENTES
Para a aplicação do método de estimativa por razão é im-prescindível o conhecimento prévio do valor médio populacional da variável auxiliar x. Queiroz (1993a) cita que, geralmente, em inventários de florestas naturais é impossível conhecer o valor médio populacional ( X ) da variável auxiliar x. O referido autor recomenda proceder à dupla amostragem para tomar xX = , acrescentando que se X é desconhecido pode-se, desde que não implique em grande aumento de custo, medir uma amostra maior para a variável x, principalmente se x for uma variável de fácil medição, como exemplo a contagem de árvores.
Seja 1n uma amostra maior de N onde será medida a vari-ável auxiliar (x). Estima-se, através da amostra de tamanho ,1na média X . Seja 2n uma subamostra de ,1n onde será medida a variável de interesse (y). Observar que em 2n são medidas as variáveis x e y. A estrutura metodológica da estimativa por razão é aplicada dentro da subamostra de tamanho ,2n caracterizando duas fases dependentes.
Admitindo que a amostragem nas duas fases seja simples ao acaso, então:
2
2ˆx
yR =
Considerando 11 Xx = , tem-se:
RCDe stLELE � , ou seja,
8846,3RC
dest
LELE �
171
Estimativa por razão
RXyRˆ
11 = e 11ˆ
RR yNY =
É evidente que a média 1Ry1R é uma estimativa da média 1Ydas 1n unidades de amostra da primeira fase. No entanto, 1Y é uma estimativa de ,Y logo se pode afirmar que 1Ry1R é uma “esti-mativa de uma estimativa de média”.
Daí, a sua variância:
1
1
2
1 1
22
1
2
21
211
)(ˆ)(
1
ˆˆ2)()(ˆ
2 22
n
yV
N
nN
n
xRyxRy
nn
nnyV
n
i
n
iiii
n
ii
R
−+
−
+−−
=∑ ∑∑
= == (7.1)
A primeira parte corresponde à variância de 1Ry1R e a segun-da parte é a variância de 1y .
A Expressão 7.1 pode ser apresentada nas formas 7.2 e 7.3.
1
12
21
21 )(ˆ)()](ˆˆ),(ˆˆ2)(ˆ)[()(ˆ
n
yV
N
nNxVRyxVRyV
nn
nnyV 1R
����
�� (7.2)
N
yV
n
xVRyxVR
n
yxVRxVRyVyV R
)(ˆ)(ˆˆ),(ˆˆ2),(ˆˆ2)(ˆ)(ˆ)(ˆ
1
2
2
2
1 −−
+−+
= (7.3)
Sendo:
;1
)(
)(ˆ
2
2
2
1
1
2
2
2
�
�
�
�� �
�
n
n
y
y
yV
n
i
in
i
i
;1
)(
)(ˆ
2
2
2
1
1
2
2
2
�
�
�
�� �
�
n
n
x
x
xV
n
i
in
i
i
.1
))(
),(ˆ
2
2
11
1
22
2
�
�
�
���
��
�
n
n
yx
yx
yxV
n
i
i
n
i
in
i
ii
172
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Se )(ˆ1RyV , tem-se: ).(ˆ)ˆ(ˆ
12
1 RR yVNYV = ).
Vries (1986) sugere usar )(1 xV que é um estimador mais preciso do que )(ˆ xV , sendo:
1
)(
)(ˆ1
1
2
1
1
2
1
1
1
−
−=
∑∑ =
=
n
n
xx
xV
n
iin
ii
exercício 7.4
Considerar as observações contidas na Tabela 7.6 como uma subamostra n2 = 30 de uma amostra maior de n1 = 50 uni-dades e que nas n1 - n2 = 20 unidades foi apenas quantificado o número de árvores.
tabela 7.6 - Estimativa por razão com igual probabilidade (AIP) com dupla amostragem.
UA xi yi UA xi yi UA xi yi UA xi UA xi
1 6 13,0 11 5 16,5 21 10 30,5 31 8 41 82 4 16,1 12 4 17,1 22 7 14,7 32 5 42 53 4 9,7 13 6 17,6 23 8 19,0 33 8 43 54 5 20,1 14 9 24,0 24 6 19,7 34 4 44 55 9 29,6 15 5 16,7 25 6 18,4 35 2 45 76 8 23,4 16 5 21,9 26 8 25,4 36 6 46 87 5 21,9 17 3 10,4 27 8 18,6 37 5 47 68 4 17,5 18 5 10,0 28 6 18,9 38 5 48 59 8 22,1 19 4 14,5 29 9 28,3 39 5 49 610 5 12,8 20 7 29,7 30 7 22,0 40 7 50 5
173
Estimativa por razão
a) informações amostrais preliminares sobre as variáveis y e x
iy = volume em m3/0,25 haix = número de árvores/0,25 ha
;501 �n ;302 �n 216.14�N
3
1 1
2
10,580 myyn
i i
ii� �� �
��
� �� �
�2 2
1 1
186
n
i
n
i
ix árvores
haárvores
x
x i
i
25,0/2,630
186
30
1
2���
��
ham
y
yi
i
25,0/3367,1930
10,580
30
31
2 ���
��
02,650
301
50
50
1
1
11
1
����
���� i
i
n
i
i x
n
x
x
6748,3229
30
10,58077,164.12
1
)(
)(ˆ
2
2
2
2
1
1
2
2
2
�
�
��
�
�
�� �
�
n
n
y
y
yV
n
i
in
ii
4759,329
30
1860,254.1
1
)(
)(ˆ
2
2
2
2
1
1
2
2
2
�
�
��
�
�
�� �
�
n
n
x
x
xV
n
i
in
i
i
0752,829
30
10,5801868,830.3
1
))((
),(ˆ
2
2
11
1
22
2
�
��
��
�
�
��� ��
�
n
n
yx
yx
yxV
n
i
i
n
i
in
i
ii
2n
2n
2n
174
Amostragem em inventário florestal Waldenei Travassos de Queiroz
b) estimativa da razão
c) estimativa por razão do valor médio
Considerando 02,61 == Xx 6,02 , tem-se:
d) estimativa por razão do valor total
e) variância do valor médio por razão
Usando as Expressões 7.2 e 7.3, têm-se os mesmos resul-tados:
árvoremx
yR /1188,3
2,6
3367,19ˆ 3
2
2 ���
hamRXy1R 25,0/7752,181188,302,6ˆ 3
1����
326,410.2687752,18296.14ˆ myNY 1R1R ����
1
1
2
1 1
22
1
2
21
21 )(ˆ)(
1
ˆˆ2
)()(ˆ
2 22
n
yV
N
nN
n
xRyxRy
nn
nnyV
n
i
n
i
iii
n
i
i
1R
��
�
���
�
� ��� ��
50
6748,32)
296.14
50296.14(
29
254.11188,38,830.31188,3277,164.12)
3050
3050()(ˆ
2�
������
�
��yV
86607081,0651210409,011453013,16013333333,0)(ˆ ����yV
1R
1R
1
12
21
21)(ˆ
)()](ˆˆ),(ˆˆ2)(ˆ)[()(ˆ
n
yV
N
nNxVRyxVRyV
nn
nnyV
1R
�
���
�
�
50
6748,32)
296.14
50296.14(]4759,31188,30752,81188,326748,32)[
3050
3050()(ˆ 2 �
������
�
��yV
86607322,0651210409,0214862812,0)(ˆ���yV
N
yV
n
xVRyxVR
n
yxVRxVRyVyV
)(ˆ)(ˆˆ),(ˆˆ2),(ˆˆ2)(ˆ)(ˆ)(ˆ
1
2
2
2
��
���
�
0,296.14
6748,32
50
475 9,31188.30752,81188,32
30
0752,81188,324759,31188,36748,32)(ˆ
22
�����
������
�yV
866077322,0750022855903,0331201781,053715703,0)(ˆ����yV
1R
1R
1R
1R
1R
175
Estimativa por razão
Cálculo de )(ˆ1RyV segundo Vries (1986).
Então:
Os cálculos referentes aos intervalos de confiança, limite de erro e outros, seguem conforme já visto.
7.6 COMPARAçãO DE DOIS íNDICES OU DUAS RAzõES
Pode ser de interesse em um inventário comparar duas ra-zões ou índices ( 1R e 2R ) entre dois tipos florestais. De acordo com o procedimento amostral, existem as seguintes situações:
1) Os índices são independentes.2) Os índices são calculados para a mesma variável auxi-
liar (x).3) Os dois índices são correlacionados.
1) os índices são independentes
Sejam 1
11
ˆx
yR = e
2
22
ˆx
yR = .
N
yV
n
xVRyxVR
n
yxVRxVRyVyV
1R
)(ˆ)(ˆˆ),(ˆˆ2),(ˆˆ2)(ˆ)(ˆ)(ˆ
1
1
2
2
1
2
��
���
�
0404,349
50
3011961
1
)(
)(ˆ
2
1
1
2
1
1
2
1
1
1
�
�
��
�
�
�� �
�
n
n
x
x
xV
n
i
in
i
i
0,296.14
6748,32
5 0
040 4,31188.30752,81188,32
30
0 752,811 88,320 404,31188,36748,3 2)(ˆ
22
1�
�����
������
RyV
809592276,0750022855903,0415923197,039595467,0)(ˆ1 ����RyV
176
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Neste caso, a variância estimada do contraste entre R1 e R2 é dada por:
)ˆ(ˆ)ˆ(ˆ)ˆˆ(ˆ2121 RVRVRRV +=−
A partir dessas informações é possível estruturar as análi-ses estatísticas de interesse, como por exemplo: testar a hipóte-se 210 : RRH = através da estatística “t” de Student e calcular o intervalo de confiança.
2) os índices são calculados para a mesma variável au-xiliar ( x )
Sejam x
yR 1
1ˆ = e .ˆ 2
2 x
yR =
Então: x
d
x
yy
x
y
x
yRR =
−=−=− 2121
21ˆˆ
Sendo:
n
dd
n
ii∑
== 1 para iii yyd 21 −=
Neste caso, a variância estimada do contraste entre R1 e R2 é dada por:
2
121221 ])ˆˆ([
)1(
1)ˆˆ(ˆ
i
n
ii xRRd
xnnRRV ∑
=
−−−
=−
Dado que:
∑∑==
−+−−=−−n
iiiiii
n
ii xRRxdRRdxRRd
1
222121
22
121 ])ˆˆ()ˆˆ(2[])ˆˆ([
177
Estimativa por razão
Então:
1
)ˆˆ()ˆˆ(21
)ˆˆ(ˆ 1 1
2221
121
2
221 −
−+−−=−
∑ ∑∑= ==
n
xRRydRRd
xnRRV
n
i
n
ii
n
iiii
3) os índices são correlacionados
Sejam 1
11
ˆx
yR = e .ˆ
2
22 x
yR =
Neste caso, a variância estimada do contraste entre R1 e R2 é:
)ˆ,ˆ(ˆ2)ˆ(ˆ)ˆ(ˆ)ˆˆ(ˆ212121 RRVOCRVRVRRV −+=−
Tal que:
1
ˆˆˆ
)1
()ˆ,ˆ(ˆ 1 1 12121122
121121
2121 −
+−−=
∑ ∑ ∑∑= = ==
n
xxRRyxRyxRyy
xxnRRVOC
n
i
n
i
n
iiiii
n
iiiii
exercício 7.5
Seja uma amostra de 20 famílias de uma população de produtores rurais. Os dados coletados estão apresentados na Tabela 7.7, onde x é o número de componentes por família; 1y é a renda líquida obtida por hectare (número de salários mínimo);
2y é a despesa por hectare (número de salários mínimo) do manejo dos recursos florestais. Confrontar os dois índices ou as duas razões pelo teste “t”.
Neste caso os índices serão calculados a partir da mesma variável auxiliar (x).
178
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 7.7 - Dados por família: comparação de dois índices ou duas razões.
Família xi 1y 2y iii yyd 21 −= ii xd
1 6 3,92 5,22 -1,30 -7,802 4 4,96 2,33 2,63 10,523 5 4,06 4,47 -0,41 -2,054 4 2,30 2,83 -0,53 -2,125 7 4,68 4,27 0,41 2,876 5 4,22 3,43 0,79 3,957 4 3,70 2,82 0,88 3,528 6 3,62 4,66 -1,04 -6,249 6 2,65 5,62 -2,97 -17,82
10 4 3,31 3,15 0,16 0,6411 5 6,38 3,88 2,50 12,5012 4 6,90 2,89 4,01 16,0413 5 6,10 4,06 2,04 10,2014 5 3,50 3,70 -0,20 -1,0015 4 1,61 3,82 -2,21 -8,8416 5 3,74 3,97 -0,23 -1,1517 6 3,89 5,08 -1,19 -7,1418 4 3,93 2,95 0,98 3,9219 6 3,77 4,45 -0,68 -4,0820 4 4,52 2,32 2,20 8,80
a) cálculo dos índices ou razões
825859,0950,4
088,4ˆ 11 ===
x
yR , 766869,0
950,4
796,3ˆ 22 ===
x
yR
b) estimativa da variância do contraste entre 1R e 2RA variância estimada do contraste entre 1R e 2R é:
1
)ˆˆ()ˆˆ(2)
1()ˆˆ(ˆ 1 1
2221
121
2
221 −
−+−−=−
∑ ∑∑= ==
n
xRRxdRRd
xnRRV
n
i
n
ii
n
iiii
179
Estimativa por razão
19
507)766869,0825859,0(72,14)766869,0825859,0(2698,59)
95,420
1()ˆˆ(ˆ
2
221
�������
�
�� RRV
0064145552,0)ˆˆ(ˆ21
�� RRV
Logo:
0800909,0)ˆˆ(ˆ)ˆˆ( 2121 =−=− RRVRRs
c) testar 210 : RRH =
ns
RRs
RRt 7365,0
0800909,0
766869,0825859,0
)ˆˆ(
ˆˆ
21
21�
�
�
�
�
�
Não há razão para rejeitar H0 : R1 = R2, visto que t19 ; 0,025 = 2,09. Conclui-se que os dois índices são estatisticamente iguais, tal que 1R é o índice referente à renda líquida por hectare e 2R é o índice referente às despesas por hectare.
19
507)766869,0825859,0(72,14)766869,0825859,0(2698,59)
95,420
1()ˆˆ(ˆ
2
221
�������
�
�� RRV
0064145552,0)ˆˆ(ˆ21
�� RRV
cApítulo 8
estImAtIvAs por regressão
Define a estimativa por regressão, descrevendo os parâ-metros populacionais e os seus estimadores. Mostra teorica-mente quando usar as estimativas por razão e por regressão. Apresenta a metodologia para obter estimativas por regressão considerando a amostragem estratificada ao acaso. Mostra exercícios aplicativos considerando várias alternativas de aná-lise, principalmente comparando as estimativas por razão e por regressão.
183
Estimativa por regressão
Em levantamentos por amostragem, como descrito no capí-tulo referente ao estudo das estimativas por razão, pode ocorrer caso em que há a necessidade de se obter estimativa da relação entre duas variáveis aleatórias x e y, normalmente correlaciona-das para cada unidade de amostra. O uso das estimativas por razão e por regressão objetiva obter maior precisão na análise dos dados, através da utilização de uma variável auxiliar xi que se correlaciona com a variável resposta de interesse yi.
A utilização da estimativa por razão é recomendada quando existir uma relação linear entre as variáveis x e y e que a reta de regressão passe pela origem do sistema de eixos coordenados.
Entretanto, pode acontecer que mesmo havendo tendência linear entre x e y a reta de regressão de y em x pode não passar pela origem do sistema de eixos coordenados. Neste caso, é recomendável e mais preciso o uso da estimativa por regressão.
8.1 PARâMETROS POPULACIONAIS E ESTIMADORES
Dado que:X = média populacional para a variável auxiliar x;Y = média populacional para a variável de interesse y;x = média amostral para a variável auxiliar x;y = média amostral para a variável de interesse y;
=RLy RL = média estimada por regressão para a variável de in-teresse y;
b = coeficiente de inclinação estimado da reta de regres-são;
B = coeficiente de inclinação populacional da reta de re-gressão;
=RLYRL = valor amostral por regressão para o valor populacio-nal da variável de interesse y;
184
Amostragem em inventário florestal Waldenei Travassos de Queiroz
N = número total de unidades da população;n = número de unidades de amostra do inventário florestal.
a) estimativa do valor médio por regressão RLy
Sejam xi e yi as observações realizadas em uma amostra de tamanho n, em que o valor médio verdadeiro X da variável x é conhecido.
Da teoria de regressão, a média estimada por regressão RLyRL para a variável de interesse y é obtida pela fórmula:
RLyRL )( xXbyyRL −+= (8.1)
Tal que: BbE =)(Pode ser verificado pela fórmula de estimação da média
por regressão 8.1 que RLyRL é um estimador consistente da média populacional, pois se Nn = , então, Xx = e ,Yy = logo:
RLyRL YxXbyyRL =−+= )(
Pode-se obter a estimativa do valor de total =RLYRL pela fórmu-la: =RLYRL RLRL yNY =ˆ
RL .
O coeficiente de inclinação ou angular b da reta de regres-são pode em alguns levantamentos ser fixado, mas, geralmente, no caso de inventários florestais deverá ser obtido através da amostra.
No caso do coeficiente angular ser fixado como zero (b = 0), verifica-se que o resultado da estimativa por regressão é o mes-mo da Amostra Simples ao Acaso (ASA).
Se 0=b , então: RLyRL yyRL = , pois RLyRL )( xXbyyRL −+= .
185
Estimativa por regressão
No caso do coeficiente angular ser xyb = , a estimativa por regressão coincide com a estimativa por razão.
Se xyb = , então, RLyRL .RRL yy =
b) variância da média do valor médio por regressão RLyRL
Sob o ponto de vista teórico, o método da estimativa por regressão, no caso de pequenas amostras, apresenta o inconve-niente de não estar devidamente solucionado o problema da defi-nição da fórmula para a obtenção da variância da média, mas no caso de grandes amostras, o que ocorre em inventários florestais, é possível obter a expressão para calcular uma boa estimativa.
A fórmula da variância da média nas estimativas por re-gressão pode ser obtida considerando as seguintes condições:
1) Variância da média com o coeficiente angular prefi-xado
No caso de inventários florestais não é usual prefixar o va-lor do coeficiente angular, mas admitindo que 0bb = :
)(0 xXbyyRL ���
Se 0b é fixado, pode-se comprovar tratar-se de um estima-dor não tendencioso, pois .)( YyE RL � . Visto que:
YxXbyEyE RL ���� )]([)( 0
Seja o desvio considerando cada unidade da população:
)()( 00 XxbYyYxXbyYye iiiiRLii ����������
186
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Pela definição de variância da média:
Por conseguinte:
Resultando:
Sendo:
Seja o questionamento: Qual o valor ideal para b0? A res-posta seria o valor de b0 que torna mínimo o valor de V ( )( RLyV RL).
Seja 8.2 a Expressão para obter o valor do coeficiente an-gular populacional B, o qual também é denominado coeficiente de regressão linear de y sobre x.
)(
),(
)(
))((
2
1
1
2
1
11
xV
yxV
N
x
x
N
yx
yx
BN
i
iN
i
i
N
i
N
i
i
N
i
i
ii
�
�
�
�
��
���
�
�
�
��
(8.2)
n
yV
N
nNyV RL
RL
)()()(
�
�
)](),(2)()[()( 2
00 xVbyxVbyVnN
nNyV RL ��
��
)](ˆ),(ˆ2)(ˆ)[()(ˆ 2
00 xVbyxVbyVnN
nNyV RL ��
��
187
Estimativa por regressão
Como b0 é um valor prefixado, seja b0 = B + k, onde B é o valor verdadeiro e k o desvio de b0 em relação a B.
Daí:
Tomando-se a primeira e a segunda derivadas dessa ex-pressão em relação à variável k, verifica-se que V ( )( RLyV RL) torna-se mínima quando k = 0. Concluindo-se que o valor de b0 que torna mínima a variância da estimativa da média é b0 = B.
Logo:
Portanto:
Dado que ])()([),(22 yVxVyxV ×=d , onde 2d é o coefi-ciente de correlação ao quadrado, então:
Resultando:
1
)()()()()(2)(
)()( 1 1
22
1
2
�
���������
�
� ��� ��
N
XxkBXxYykBYy
nN
nNyV
N
i
N
i
ii
N
I
ii
RL
1
)()()(2)(
)()( 1 1
22
1
2
min�
�������
�
� ��� ��
N
XxBXxYyBYy
nN
nNyV
N
i
N
i
ii
N
I
ii
RL
)](),(2)()[()( 2
minxVByxVByV
nN
nNyV
RL��
��
)}(])(
),([),(
)(
),(2)(){()( 2
min xVxV
yxVyxV
xV
yxVyV
nN
nNyV RL ��
��
])(
),()()[()(
2
minxV
yxVyV
nN
nNyV RL �
��
])()()[()( 2
min yVyVnN
nNyV RL ��
��
)]1)(()[()( 2
min ���
� yVnN
nNyV RL
188
Amostragem em inventário florestal Waldenei Travassos de Queiroz
2) Variância da média com o coeficiente angular esti-mado através da amostra
Seja uma amostra de n pares de valores xi e yi. Da teoria de Regressão Linear Simples, pelo método dos quadrados mí-nimos, tem-se que a estimativa do coeficiente angular B da reta, denominado também de coeficiente de regressão, é dada pela fórmula:
n
x
x
n
yx
yx
bn
i
in
i
i
n
i
n
i
i
n
i
i
ii
2
1
1
2
1
11
)(
))((
��
���
�
�
�
��
�
�
�
Então:
Em termos populacionais, sendo E(b) = B, pode-se escrever:)( XxBYye iii −−−=
Seja:
2
11
2 )]([ XxBYye ii
N
i
N
i
i ���� ����
Da definição de variância da média:
)( xXbyyRL ���
1)()( 1
2
�
��
��
N
e
Nn
nNyV
N
i
i
RL
189
Estimativa por regressão
Como:
�
�
�
�
�
��
�N
i
i
N
i
ii
Xx
YyXx
B
1
2
1
)(
))((
Então:
� �� �
����N
i
N
i
iii XxBYyXx1 1
2)())((
Logo:
1
)()(2)(
)()( 1 1
22
1
222
�
������
�
� ��� ��
N
XxBXxBYy
Nn
nNyV
N
i
N
i
i
N
i
ii
RL
1
)()(
)()(1 1
222
�
����
�
� �� �
N
XxBYy
Nn
nNyV
N
i
N
i
ii
RL
Dado que:
� �
�
� �
�
��
��
�N
i
N
i
ii
N
i
ii
YyXx
YyXx
1 1
22
2
12
])(][)([
]))(([
�
1
)]()[(
)()( 1
2
�
����
�
��
N
XxBYy
Nn
nNyV
N
i
ii
RL
1
])())((2)[(
)()( 1
222
�
�������
�
��
N
XxBYyXxBYy
Nn
nNyV
N
i
iiii
RL
190
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Então:
∑
∑
=
=
−
−=
N
ii
N
ii
Yy
XxB
1
2
1
22
2
)(
)(d
Portanto:
∑
∑
=
=
−
−=
N
ii
N
ii
Xx
YyB
1
2
1
22
2
)(
)(d
Por conseguinte:
Finalmente, a fórmula da estimativa da variância da esti-mativa da média por regressão, tal que o coeficiente angular é estimado através da amostra, é:
A estimativa da variância da estimativa da média pela re-gressão também pode ser obtida usando-se a teoria da análise de regressão simples.
1
)()(
)()( 1 1
222
�
����
�
� �� �
N
YyYy
Nn
nNyV
N
i
N
i
ii
RL
�
)1)(()()( 2���
� yVNn
nNyV RL
)ˆ1)((ˆ)()(ˆ 2��
�� yV
Nn
nNyV RL
sRL MQNn
nNyV Re
ˆ)()(ˆ �
� , tal que .2
ˆˆ Re
Re�
�
n
QSMQ s
s
191
Estimativa por regressão
O termo sQS Reˆ
Resé a soma estimada de quadrados do resíduo da regressão linear simples. O divisor n - 2 produz uma estima-tiva sem tendência de V (y) quando a população é infinita e a regressão é linear.
Dado RLyRL e V ( RLyRL), pode-se obter:
Pode-se comparar a precisão considerando a metodologia da amostra simples ao acaso em relação à estimativa por re-gressão.
Sejam as respectivas variâncias da média: Variância da média para a amostra simples ao acaso:
)()()( yVnN
nNyV
−=
Variância da média para a estimativa por regressão:
Da comparação dessas expressões, conclui-se que se 0=d implica que V ( RLyRL) = V ( RLy). Então, a amostra simples ao
acaso tem a mesma precisão da estimativa por regressão.Se 02 >d implica que V ( RLyRL) < V ( RLy), então a amostra sim-
ples ao acaso é menos precisa que a estimativa por regressão.
c) intervalo de confiança para a média Y e para o valor total Y
RLRL yNY �ˆ e )(ˆ)ˆ( 2
RLRL yVNYV �
)1)(()()( 2��
�� yV
nN
nNyV RL
192
Amostragem em inventário florestal Waldenei Travassos de Queiroz
exercício 8.1
Seja uma área florestal populacional de 100 ha com ocor-rências de 405 árvores matrizes (dados simulados). O objetivo é monitorar a produção de sementes de uma determinada espécie florestal. A área está subdividida em 100 subáreas de 1 ha. As 405 matrizes da espécie em estudo estão perfeitamente locali-zadas em um mapa logístico. A Tabela 8.1 apresenta os dados de produção de sementes e o número de árvores referentes a uma amostra de n = 38 unidades (38 ha), obter:
1) a estimativa por razão; 2) a estimativa sem considerar a variável auxiliar (número
de árvores);3) a estimativa por regressão;4) concluir sobre os resultados.
Dado:iy = Peso de sementes por haix = Número de árvores por ha
tabela 8.1 - Produção em kg de sementes (yi) e número de árvores (xi).
Unid xi yi Unid xi yi Unid xi yi
1 5 16,15 14 4 12,57 27 5 14,582 3 10,53 15 4 10,88 28 5 14,143 4 8,50 16 4 13,03 29 3 11,944 5 11,90 17 3 11,11 30 5 12,375 3 9,07 18 4 10,28 31 3 11,036 4 13,23 19 5 13,14 32 5 12,717 4 11,48 20 5 13,44 33 3 8,938 5 14,71 21 6 14,14 34 6 15,759 3 10,95 22 4 15,40 35 2 10,71
10 4 15,31 23 5 12,20 36 7 15,0111 4 11,26 24 4 12,58 37 6 13,7612 4 11,73 25 4 13,13 38 3 8,1913 7 16,42 26 6 14,39
Total 166 476,65
193
Estimativa por regressão
1) estimativa por razão
a) cálculo da estimativa da razão
Peso de sementes total e número total de árvores na amostra:
kgyn
i
i��
�1
65,476
��
�n
i
ix1
166 árvores
871386,2166
65,476ˆ
1
1 ���
�
�
�
�
n
i
i
n
i
i
x
y
R
b) estimativa da variância de R
)],(ˆˆ2)(ˆˆ)(ˆ[)ˆ(ˆ 2
2yxVRxVRyV
XnN
nNRV ��
��
Dado que:
haárvoresX /05,4100
405��
2)/(5477,4)(ˆ hakgyV �
2)/(3741,1)(ˆ haárvoresxV � e 8090,1),(ˆ �yxV , tem-se:
)8090,1871386,223741,1871386,25477,4(05,410038
38100)ˆ(ˆ 2
2�����
��
��RV
005459271,0)ˆ(ˆ�RV
c) estimativa do desvio padrão de R
073887,012803270054592708,0)()ˆ( ===∧
RVRs
194
Amostragem em inventário florestal Waldenei Travassos de Queiroz
d) intervalo de confiança para R
Seja t = 2,0278 o valor da distribuição de Student com 37 graus de liberdade para o nível de significância a = 0,05, têm-se:
Limite inferior 721558,2073887,00278,2871386,2)ˆ(ˆ =×−=×− RstR
Limite superior021214,3073887,00278,2871386,2)ˆ(ˆ =×+=×+ RstR
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor verdadeiro ou paramétrico da razão encontra-se no intervalo de 2,721558 a 3,021214.
e) estimativa da média da produção de sementes Ry e sua variância )(ˆ
RyV
hakgXRyR
/6291,1105,4871386,2ˆ����
222)/(08954569,00054592708,005,4)ˆ(ˆ)(ˆ hakgRVXyV
R����
hakgyVhays RR /299242,0)(ˆ/)( ��
f) estimativa do total RY e sua variância )(ˆRyV
kgXNRYR
91133,162.105,4100871386,2ˆˆ�����
22222456893,8950054592708,005,4100)ˆ(ˆ)ˆ(ˆ kgRVXNYV R �����
kgYVYsRR
92418575,29)ˆ(ˆ)ˆ( ��
g) intervalo de confiança para o valor médio Y
Limite inferiorhakgysty RR /02229707,11299242,00278,26291,11)( ������
195
Estimativa por regressão
Limite superior
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 11,022297 kg/ ha a 12,235903 kg/ ha.
h) intervalo de confiança para o valor total Y
Limite inferior kgYstY
RR231066,110292418575,290278,291133,1162)ˆ(ˆ
������
Limite superiorkgYstY RR 591594,122392418575,290278,291133,1162)ˆ(ˆ
������
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 1.102,231066 kg a 1223,591594 kg.
i) limite de erro da estimativa por razão
%217970,56291,11
299242,00278,2)( �
��RyLE
2) estimativa sem considerar a variável auxiliar (núme-ro de árvores)
a) valor médio sem considerar a variável auxiliar
hakgn
y
y
n
i
i
/5434,1238
65,4761 ���
��
hakgystyRR
/235903,12299242,00278,26291,11)( ������
196
Amostragem em inventário florestal Waldenei Travassos de Queiroz
b) variância da média sem considerar a variável auxiliar
Sendo:
2
1
2
1
2
)/(54770960,41
)(
)(ˆ hakgn
n
y
y
yV
n
i
in
i
i
��
�
�
��
�
�
c) limite de erro da estimativa sem considerar a variável auxiliar
%4036,45434,12
2723958,00278,2)( �
�
�yLESV
d) eficiência da estimativa da média por razão versus a da média sem considerar a variável auxiliar.
A eficiência é definida como o quociente entre o limite de erro da média sem considerar a variável auxiliar versus o valor obtido pelo método da razão.
8439,0217970,5
403624,4
)(
)( ���R
SV
yL
yLEEf
O resultado mostra que o limite de erro correspondente à análise sem considerar a variável auxiliar apresenta um valor correspondente a 84,39% do valor do limite de erro pelo método por razão. O método sem considerar a variável auxiliar é 18,49% mais eficiente que o por razão, visto que:
2)/(074199472,0)100
38100(
38
54770960,4)(
)(ˆ)(ˆ hakg
N
nN
n
yVyV �
�
�
�
�
hakgyVys /274199472,0074199472,0)(ˆ)( ���
197
Estimativa por regressão
O banco de dados do exemplo apresentado não é adequa-do para o uso da estimativa por razão, visto que, se realizada uma análise de regressão simples, ter-se-á os seguintes resul-tados:
Reta de regressão linear simples: Y = 6,7925+1,3165x
tabela 8.2 - Análise de variância da regressão.
CV GL SQ QM F
Regressão 1 88,114 88,114 39,58
Resíduo 36 80,151 2,226
Total 37 168,265
Teste para verificar a hipótese se o parâmetro linear a é diferente de zero, tal que
iiiebXaY ��� ::
sn
i
in
i
i
MQ
n
x
x
x
naV Re
2
1
1
2
2
ˆ]
)(
1[)ˆ(ˆ
��
�
�
�
��
síduoMQ Reˆ
Resíduo = Quadrado médio do resíduo estimado
226,2)84210526,50
08310249,19
38
1(226,2)
38
166776
)38
166(
38
1()ˆ(ˆ
2
2
����
�
��aV
894086956,0)ˆ(ˆ�aV
1849,1403624,4
217970,5
)(
)( ���yL
yLEEf R
198
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Dado que:
1836,7894086956,0
7925,6
)ˆ(ˆ
ˆ===
aV
at
Conclui-se pela rejeição de .0:0 =aH
A estimativa por razão não é recomendável quando o coe-ficiente linear ( a ) é diferente de zero.
3) estimativa por regressão
a) produção média de sementes por regressão
Dado:
;65,4761
��
�n
i
iy ;1661
��
�n
i
ix ;14,21491
��
�n
i
ii yx
;0869,61471
2
��
�n
i
iy ;00,7761
2
��
�n
i
ix 05,4100
405��X
Então:
316469979,1
38
166776
38
65,47616614,2149
)(
))((
22
1
1
2
1
11
�
�
��
�
�
�
�
��
���
�
�
�
��
n
x
x
n
yx
yx
bn
i
in
i
i
n
i
n
i
i
n
i
i
ii
Destarte:
)38
16605,4(316469979,1
38
65,476)( ������ xXbyyRL
199
Estimativa por regressão
b) estimativa da variância de RLyRL
Dado que:
)38
65,4760869,6147)(
38
166776(
)38
65,47616614,2149(
]
)(
][
)(
[
]
))((
[
ˆ22
2
1
1
2
2
1
1
2
2
211
12
��
��
�
��
�
�
��
��
���
�
�
�
�
��
�
n
i
n
i
i
i
n
i
n
i
i
i
n
i
i
n
i
in
i
ii
n
y
yn
x
x
n
yx
yx
�
523661923,0959825,8554
906715,479.4ˆ2���
2
2
2
1
1
2
)/(547709602,437
38
65,4760869,6147
1
)(
)(ˆ hakgn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
�� �
�
Então:
)523661923,01(54770902,438100
38100)ˆ1)((ˆ)()(ˆ 2
����
���
�� �yV
Nn
nNyV
RL
2)/(035344029,0)(ˆ hakgyV RL �
hakgyVhays RLRL /1880,0)(ˆ/)( ��
Para grandes amostras, como neste exemplo, a variância da média pode ser obtida da seguinte forma:
Da análise de variância apresentada na Tabela 8.2, tem-se:226,2ˆ
Re �sMQ
2
Re )/0363189,0(226,2)38100
38100(ˆ)()(ˆ hakgMQ
Nn
nNyV sRL ��
�
�
�
�
�
hakgxXbyyRL /1242293,12)( ����
200
Amostragem em inventário florestal Waldenei Travassos de Queiroz
c) estimativa do total RLYRL e sua variância )ˆ(ˆRLYV ( RLYRL)
kgyNY RLRL 42293,212.11242293,12100ˆ����
22244029,353035344029,0100)(ˆ)ˆ(ˆ kgyVNYV RLRL ����
kgYVYs RLRL 80,18)ˆ(ˆ)ˆ( ��
d) intervalo de confiança para o valor médioY
Limite inferior
Limite superior
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 11,7430 kg/ ha a 12,5055 kg/ ha.
e) intervalo de confiança para o valor total Y
Limite inferiorkgysty RLRL 3003,174.180,180278,242293,1212)( ������
Limite superior
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 1.174,3003 kg a 1.250,5456 kg.
201
Estimativa por regressão
f) limite de erro da estimativa por regressão
%144335,31242293,12
1880,00278,2)( �
�
�RLyLE
g) eficiência da estimativa por regressão versus a média sem considerar a variável auxiliar.
A eficiência é definida como o quociente entre o valor do limite de erro da média sem considerar a variável auxiliar versus o obtido pelo método da regressão.
4005,1144335,3
403624,4
)(
)( ���RLyLE
yLEEf
O resultado mostra que o limite de erro correspondente à aná-lise sem considerar a variável auxiliar apresenta um valor 40,05% maior que o obtido pelo método por regressão, demonstrando que este método possui uma eficiência superior que aquele.
h) eficiência da estimativa por regressão versus a da média por razão
A eficiência é definida como o quociente entre o limite de erro da média por razão versus ao da média estimada pelo mé-todo da regressão.
6595,1144335,3
217970,5
)(
)( ���RL
R
yLE
yLEEf
O resultado mostra que o limite de erro correspondente à média por razão apresenta um valor 65,95 % superior ao obti-do pelo método por regressão, demonstrando que este método possui uma eficiência superior que aquele.
Como a hipótese da nulidade ( 0:0 =aH ) foi rejeitada e a correlação entre a variável de interesse e variável auxiliar é de
202
Amostragem em inventário florestal Waldenei Travassos de Queiroz
72,36%, fica evidente que o processo de estimativa por regres-são é mais eficiente que os demais.
8.2 ESTIMATIVAS POR REGRESSãO CONSIDERANDO A AMOSTRA ESTRATIFICADA AO ACASO
As estimativas por regressão na amostragem estratificada podem ser obtidas pelos seguintes procedimentos:
1) as estimativas por regressão são obtidas na forma usual da amostragem estratificada considerando cada estrato separa-damente;
2) as estimativas por regressão são obtidas a partir das médias estratificadas das variáveis y e x, considerando os estra-tos conjuntamente, ou seja, usando esty e .estx
1) estimativas por regressão considerando os estratos separadamente
Este procedimento deve ser adotado quando os verdadeiros valores dos coeficientes angulares hB variam entre os estratos.
a) valor médio por regressão considerando os estratos se-paradamente
)( hhhhRL xXbyyh
���
b) valor total por regressão considerando os estratos sepa-radamente
hh RLhRL yNY �ˆ
203
Estimativa por regressão
c) valor médio global por regressão considerando separa-damente os estratos
��
�L
i
RLhRL hSyWy
1
d) valor total global por regressão considerando separada-mente os estratos
Da teoria da amostragem estratificada:
������
����L
h
RL
L
h
RLh
L
h
RLhRLRL hhhSSYyNyWNyNY
111
ˆˆ
e) variância do valor médio global por regressão conside-rando os estratos separadamente
A variância da média estratificada da estimativa por regres-são considerando os estratos separadamente )](),(2)([
)()(
2
00
1
2
xVbyxVbyVNn
nNWyV hhhhh
L
h hh
hhh
RLS��
�� �
�
, com os coeficientes angulares por estrato prefixados ( hb0 ), é dada pela expressão:
)](),(2)([)(
)(2
00
1
2
xVbyxVbyVNn
nNWyV hhhhh
L
h hh
hhh
RLS��
�� �
�
Como, geralmente, em inventários florestais, o tamanho das amostras por estratos ( hn ) não é pequeno, os coeficientes angulares podem ser estimados pela expressão:
h
n
i
hin
i
hi
n
i h
n
i
hi
n
i
hi
hihi
h
n
x
x
n
yx
yx
b
h
2
1
1
2
1
11
)(
))((
��
���
�
�
�
��
�
�
�
204
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Por conseguinte:)( hhhhRL xXbyy
h���
Então, a expressão da variância da média estratificada da estimativa por regressão considerando os estratos separa-damente )](),(2)([
)()(
2
00
1
2
xVbyxVbyVNn
nNWyV hhhhh
L
h hh
hhh
RLS��
�� �
�
, com os coeficientes angulares estimados por estrato ( hb ), é:
��
�L
I
RLhRL hSyVWyV
!
2 )(ˆ)(ˆ
Dado que:
)1)(()()( 2
hh
hh
hh
hRL yVnN
nNyV ��
��
E a sua estimativa:
)ˆ1)((ˆ)()(ˆ 2
hh
hh
hh
hRLyV
nN
nNyV ��
�� ou s
hh
hhRL MQ
nN
nNyV
h Reˆ)()(ˆ �
�
2) estimativas por regressão a partir das médias es-tratificadas das variáveis y e x, considerando os estratos conjuntamente, ou seja, usando esty e .estx
Este procedimento deve ser adotado quando não houver grande variação entre os verdadeiros valores dos coeficientes angulares hB entre os estratos.
a) valor médio por regressão considerando conjuntamente os estratos
Dado que: ��
�L
I
hhEs txWx
!
e ��
�L
I
hhEst yWy!
e ��
�L
I
hhEs txWx
!
e ��
�L
I
hhEst yWy!
, então:
)( EstcEstRL xXbyyC
���
205
Estimativa por regressão
O coeficiente da regressão cb é obtido considerando o conjunto total dos dados:
��
�
���
�
�
�
�
�
��
�
��
�
��
�
�
L
h h
n
i
hin
i
hi
hh
hh
L
h h
n
i
ih
n
i
hin
i
hihi
hh
hh
c
n
x
xnn
fW
n
yx
yxnn
fW
bh
i
hh
h
1
2
1
1
22
1
11
1
2
]}
)(
[)1(
)1({
]}
))((
[)1(
)1({
Se a alocação for proporcional e no caso de grandes amos-tras, substituir )1( −hn por hn , resultará:
��
�
���
�
�
�
�
�
��
�
�
�
�
L
h h
n
i
hin
i
hi
L
h h
n
i
ih
n
i
hin
i
hihi
c
n
x
x
n
yx
yx
bh
i
hh
h
1
2
1
1
2
1
11
1'
]
)(
[
]
))((
[
Pois:n
n
N
N hh �
��
�
���
�
�
�
�
�
��
�
�
�
�
L
h h
n
i
hin
i
hi
L
h h
n
i
ih
n
i
hin
i
hihi
c
n
x
x
n
yx
yx
bh
i
hh
h
1
2
1
1
2
1
11
1'
]
)(
[
]
))((
[
Pois:n
n
N
N hh �
b) valor total por regressão considerando conjuntamente os estratos
CC RLRL yNY ��ˆ
c) variância do valor médio global por regressão conside-rando conjuntamente os estratos
A fórmula da variância da média estratificada da estimativa por regressão )](),(2)([
)()(
2
00
1
2
xVbyxVbyVNn
nNWyV hhhhh
L
h hh
hhh
RLS��
�� �
�
, considerando os coeficientes angulares por estrato hb0 prefixados, é:
206
Amostragem em inventário florestal Waldenei Travassos de Queiroz
)](ˆ),(ˆ2)(ˆ[)(
)(ˆ 2
0
1
2
xVbyxVbyVNn
nNWyV hohhhh
L
h hh
hhhRLC
���
� ��
Quando o valor do coeficiente angular é obtido através da amostra, tem-se:
)](ˆ),(ˆ2)(ˆ[)(
)(ˆ 2
0
1
2
xVbyxVbyVNn
nNWyV hohhhh
L
h hh
hhhRLC
���
� ��
])(),(2)()[()(1
2
��
���
�L
h
hchch
hh
hhRL xVbyxVbyV
nN
nWyV
C
2
E sua estimativa:
])(ˆ),(ˆ2)(ˆ[)1(
)(ˆ
1
22
��
���
�L
h
hchch
h
hhRL xVbyxVbyV
n
fWyV
C
exercício 8.2
Um produtor florestal possui uma área de 1200 ha. A área apresenta três tipos florestais (três estratos) com ocorrência de castanha do brasil. As árvores de castanha do brasil estão iden-tificadas e plotadas em um mapa logístico, o que permite co-nhecer o número total populacional de árvores por estrato. Os estratos estão subdivididos em unidades de 1 ha.
Os dados foram simulados considerando uma amostra sim-ples ao acaso de uma população binormal por estrato ( 1n = 40,
2n = 39 e 3n = 38). A Tabela 8.3 apresenta os vetores de médias e matrizes de covariâncias por estrato considerando a produ-ção de sementes de castanha (y) e o número de árvores (x) por parcela de 1 ha. A Tabela 8.4 apresenta os dados das amostras simples ao acaso por estrato ( 1n = 40, 2n = 39 e 3n = 38). A Tabe-la 8.5 apresenta as informações populacionais sobre a variável auxiliar (número de árvores).
207
Estimativa por regressão
1) Obter as estimativas por regressão por estrato e compa-rar os resultados sem considerar a variável auxiliar número de árvores.
2) Efetuar a análise global para as estimativas por regres-são considerando os estratos separadamente e comparar os re-sultados sem considerar a variável auxiliar número de árvores.
3) Obter a análise global para as estimativas por regressão considerando os estratos conjuntamente, ou seja, a partir de Esty e Estx , e comparar os resultados sem considerar a variável auxi-liar número de árvores.
4) Comparar os resultados das estimativas por regressão considerando os estratos separadamente versus os estratos conjuntamente ( Esty e Estx ).
5) Discutir e concluir sobre os resultados principalmente sem usar a variável auxiliar número de árvores.
tabela 8.3 - Vetores das médias e as matrizes de covariâncias da população.
Est Vetor de médias Matriz de covariância
I 30
10
16 7,2
7,2 4
II 20
18
9 5,7
5,7 5
III 21
5
4 2,3
2,3 2
8
20
8
20
8
20
8
20
8
20
8
20
8
20
8
20
8
20
8
20
8
20
8
20
208
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 8.4 - Dados das amostras simples ao acaso por estrato.
UAEstrato I Estrato II Estrato III
y x y x y x 1 28,37 10 21,8 6 15,47 62 26,69 9 21,0 9 15,14 83 40,84 16 23,5 11 12,90 44 34,03 11 19,6 8 14,24 35 23,61 8 22,6 9 15,37 66 28,03 9 17,3 5 12,71 57 25,43 9 18,3 8 9,66 38 33,16 11 21,9 10 11,29 39 37,17 14 21,5 7 7,89 6
10 38,26 14 25,5 12 8,71 411 28,12 9 16,7 8 14,04 612 23,10 8 19,3 8 11,55 513 32,21 8 21,5 10 13,79 314 26,30 10 18,0 6 13,25 615 29,39 8 21,4 9 13,29 716 27,28 8 27,4 12 14,91 817 29,08 9 21,3 3 14,33 618 29,33 11 19,2 11 11,18 519 29,91 12 18,5 7 15,37 620 36,48 11 17,9 7 11,12 421 33,42 12 25,6 11 14,36 722 29,52 11 23,4 10 13,91 823 34,08 13 25,2 12 11,33 524 22,18 7 23,8 10 12,79 425 29,03 11 23,1 9 10,11 726 28,43 9 18,9 6 12,79 427 32,69 12 25,5 12 15,87 728 24,76 8 20,9 8 11,88 429 34,00 11 22,1 10 12,38 530 26,66 9 16,8 5 12,95 431 31,66 10 19,3 7 11,55 732 34,26 13 18,1 8 13,58 633 30,45 11 16,8 6 12,03 634 32,93 11 20,6 13 14,02 635 25,86 9 21,6 8 9,37 436 29,59 10 20,5 9 14,15 537 30,32 10 19,3 6 12,38 538 29,91 10 13,3 3 11,57 539 28,33 10 20,2 840 27,59 9
209
Estimativa por regressão
tabela 8.5 - Número de árvores por estrato (População).
Estrato Área em ha N0 de árvores por estrato N0 de árvores/ha
I 600 6.240,0 10,40
II 360 3.060,0 8,50
III 240 1.248,0 5,20
1) estimativas por regressão por estrato e comparação dos resultados sem considerar a variável auxiliar número de árvores
Sabe-se que:
;5,0
200.1
6001
��ha
haW ;3,0
200.1
3602
��ha
haW 2,0
200.1
2403
��ha
haW
;6001
�N 3602
�N ; 2403
�N
a) estimativa por regressão para o estrato Ia1) produção média de sementes por regressão
Dado:
;460,202.11
1
1��
�
n
i
iy ;4111
1
1��
�
n
i
ix ;2,624.121
1
11��
�
n
i
ii yx
;649,821.361
1
2
1��
�
n
i
iy ��
�1
1
2
1 369.4
n
i
ix ;240.61
1
1��
�
N
i
ix ;6001 �N
haárvoresN
x
X
N
i
i
/4,10600
240.6
1
1
1
1
1
���
��
210
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Então:
1
2
1
1
1
2
1
1 1
1
1
1
1
1
1
)(
))((
1
1
1
11
n
x
x
n
yx
yx
bn
i
in
i
i
n
i
n
i
i
n
i
i
ii
��
���
�
�
�
��
�
�
�
842257236,1
40
411369.4
40
46,202.14112,624.12
21 �
�
��
�b
)40
4114,10(842257236,1
40
46,202.1)( 11111
������ xXbyyRL
hakgyRL
/29178215,301
�
a2) estimativa da variância de
Dado:
��
��
���
�
�
�
�
��
�
��
�
�
1
1
1
1
11
1
1 1
1
2
12
1
1 1
1
2
12
1
2
1
1
1
1
1
1
11
2
1
]
)(
][
)(
[
]
))((
[
ˆ
n
i
n
i
i
i
n
i
n
i
i
i
n
i
i
n
i
in
i
ii
n
y
yn
x
x
n
yx
yx
�
735165376,0
)40
46,202.1649,821.36)(
40
411369.4(
]40
46,202.14112,624.12[
ˆ22
2
2
1�
��
��
��
2
2
1
1
2
1
1
1
2
1
1 )/(27942846,1739
40
46,202.1649,36821
1
)(
)(ˆ
1
1
hakgn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
�� �
�
1
2
1
1
1
2
1
1 1
1
1
1
1
1
1
)(
))((
1
1
1
11
n
x
x
n
yx
yx
bn
i
in
i
i
n
i
n
i
i
n
i
i
ii
��
���
�
�
�
��
�
�
�
842257236,1
40
411369.4
40
46,202.14112,624.12
21 �
�
��
�b
)40
4114,10(842257236,1
40
46,202.1)( 11111
������ xXbyyRL
hakgyRL
/29178215,301
�
211
Estimativa por regressão
Então:
)735165376,01(27942846,1740600
40600)ˆ1)((ˆ)()(ˆ 2
11
11
11
1���
�
���
�� �yV
nN
nNyV
RL
2)/(106777788,0)(ˆ
1hakgyV RL �
hakgyVhays RLRL /326768708,0)(ˆ/)(11
��
a3) estimativa do total
1
2
1
1
1
2
1
1 1
1
1
1
1
1
1
)(
))((
1
1
1
11
n
x
x
n
yx
yx
bn
i
in
i
i
n
i
n
i
i
n
i
i
ii
��
���
�
�
�
��
�
�
�
842257236,1
40
411369.4
40
46,202.14112,624.12
21 �
�
��
�b
)40
4114,10(842257236,1
40
46,202.1)( 11111
������ xXbyyRL
hakgyRL
/29178215,301
�e sua variância
kgyNY RLRL 06929,175.1829178215,30600ˆ11
����
222 00368,440.38106777788,0600)(ˆ)ˆ(ˆ11
kgyVNYV RLRL ����
kgyVYs RLRL 0612243,196)ˆ(ˆ)ˆ(11
��
kgyNY RLRL 06929,175.1829178215,30600ˆ11
����
222 00368,440.38106777788,0600)(ˆ)ˆ(ˆ11
kgyVNYV RLRL ����
kgyVYs RLRL 0612243,196)ˆ(ˆ)ˆ(11
��
a4) intervalo de confiança do valor médio populacional 1Y
Limite inferiorhakgysty
RLRL/630958,29326768708,00223,229178215,30)(
11������
Limite superior
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato I encontra-se no in-tervalo de 29,630958 kg de sementes/ ha a 30,61855 kg de se-mentes/ ha.
a5) intervalo de confiança para o valor total 1Y
Limite inferiorkgYstY
RLRL57468,778.17061224,1960223,206929,175.18)ˆ(ˆ
11
������
212
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Limite superiorkgYstY
RLRL5639,571.180612243,1960223,206929,175.18)ˆ(ˆ
11������ 18.175,06929 + 2,0223 x 196,0612243 = 18.571,5639 kg
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato I encontra-se no intervalo de 17.778,57468 kg de sementes a 18.571,5639 kg de sementes.
a6) limite de erro da estimativa por regressão
%1815,210029178215,30
326768708,00223,2)()(
1
1
1��
��
�
�
RL
RL
RLy
ystyLE
a7) limite de erro da estimativa sem considerar a variável auxiliar número de árvores
Dado:
hakgn
y
y
n
i
i
/0615,3040
46,202.1
1
1
1
1
1
���
��
2
1
11
1
1
1)/(403186664,0)
600
40600(
40
27942846,17)(
)(ˆ)(ˆ hakg
N
nN
n
yVyV �
��
��
)/(634970,0403186664,0)(ˆ)( 11 hakgyVys ���
Então,
%2716,41000615,30
634970,00223,2100
)()(
1
1
1 ��
�
��
�
�
y
ystyLE SV
a8) eficiência da estimativa da média por regressão versus a da média sem considerar a variável auxiliar número de árvores
A eficiência é definida como o quociente entre o limite de erro sem considerar a variável auxiliar versus o valor obtido pelo método da regressão.
213
Estimativa por regressão
O resultado do estrato I mostra que o limite de erro corres-pondente à análise sem considerar a variável auxiliar apresenta um valor 95,81% superior ao encontrado pelo método por regres-são, demonstrando ser este método mais eficiente que aquele.
b) estimativa por regressão para o estrato II
Dado:
;2,8092
1
2��
�n
i
iy ;9,124.171
2
2��
�i
iy ;3272
1
2��
�
n
i
ix ;060.32
1
2��
�N
i
ix
;969.21
2
2��
�i
ix ;8,987.62
1
22��
�
n
i
ii yx ;3602
�N
haárvoresN
x
X
N
i
i
/5,8360
060.3
2
1
2
2
2
���
��
2n
2n
b1) produção média de sementes por regressão
893229519,0
39
327969.2
39
2,8093278,987.6
)(
))((
ˆ2
2
2
1
2
1
2
2
1 2
1
2
1
2
21
22
2
2
22
�
�
��
�
�
�
�
��
���
�
�
�
��
n
x
x
n
yx
yx
bn
i
in
i
i
n
i
n
i
i
n
i
i
ii
)39
3275,8(893229519,0
39
2,809)( 22222
������ xXbyyRL
hakgxXbyyRL /85178289,20)( 22222����
9581,11815,2
2716,4
)(
)(
1
1 ���RL
SV
yLE
yLEEf
214
Amostragem em inventário florestal Waldenei Travassos de Queiroz
b2) estimativa da variância de
1
2
1
1
1
2
1
1 1
1
1
1
1
1
1
)(
))((
1
1
1
11
n
x
x
n
yx
yx
bn
i
in
i
i
n
i
n
i
i
n
i
i
ii
��
���
�
�
�
��
�
�
�
842257236,1
40
411369.4
40
46,202.14112,624.12
21 �
�
��
�b
)40
4114,10(842257236,1
40
46,202.1)( 11111
������ xXbyyRL
hakgyRL
/29178215,301
�
Dado que:
��
��
���
�
�
�
�
��
�
��
�
�
2
2
2
2
22
2
1 2
1
2
22
2
1 2
1
2
22
2
2
2
1
2
1
2
1
22
2
2
]
)(
][
)(
[
]
))((
[
ˆ
n
i
n
i
i
i
n
i
n
ii
n
i
i
n
i
in
i
ii
n
y
yn
x
x
n
yx
yx
�
541127912,0
)39
2,8099,124.17)(
39
327969.2(
]39
2,8093278,987.6[
ˆ22
2
2
2 �
��
��
��
2
2
2
2
2
1
2
1
2
2
)/(816774629,838
39
2,8099,124.17
1
)(
)(ˆ
2
2
2hakg
n
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
�� �
�
Então:
)541127912,01(816774629,839360
39360)ˆ1)((ˆ)()(ˆ 2
22
22
22
2���
�
���
�� �yV
nN
nNyV
RL
22
22
22
22 )/(092499483,0)ˆ1)((ˆ)()(ˆ2
hakgyVnN
nNyV
RL��
�� �
hakgyVhays RLRL /304137276,0)(ˆ/)(22
��
b3) estimativa do total kgyNY RLRL 64184,506.785178289,20360ˆ22 2 ����
222
2 933,987.11092499483,0360)(ˆ)ˆ(ˆ22
kgyVNYV RLRL ����
kgYVYs RLRL 4894196,109)ˆ(ˆ)ˆ(22
��
e sua variância )ˆ(ˆ2RlYV ( kgyNY RLRL 64184,506.785178289,20360ˆ
22 2 ����
222
2 933,987.11092499483,0360)(ˆ)ˆ(ˆ22
kgyVNYV RLRL ����
kgYVYs RLRL 4894196,109)ˆ(ˆ)ˆ(22
��
)
kgyNY RLRL 64184,506.785178289,20360ˆ22 2 ����
222
2 933,987.11092499483,0360)(ˆ)ˆ(ˆ22
kgyVNYV RLRL ����
kgYVYs RLRL 4894196,109)ˆ(ˆ)ˆ(22
��
215
Estimativa por regressão
b4) intervalo de confiança do valor médio populacional 2Y
Limite inferiorhakgysty
RLRL/23581368,20304137276,00253,285178289,20)(
22
������
Limite superior hakgysty RLRL /46775212,21304137276,00253,285178289,20)(
22������
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato II encontra-se no in-tervalo de 20,23581368 kg de sementes/ ha a 21,46775212 kg de sementes/ ha.
b5) intervalo de confiança do valor total populacional 2Y
Limite inferiorkgYstY
LRLR892918,284.74894196,1090253,264184,506.7)ˆ(ˆ
22
����� �
Limite superiorkgYstY
RLLR390762,728.74894196,1090253,264184,506.7)ˆ(ˆ
22����� �
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato II encontra-se no intervalo de 7.284,892918 kg de sementes a 7.728,390762 kg de sementes.
b6) limite de erro da estimativa por regressão
%9540,210085178289,20
304137276,00253,2100
)()(
2
2
2��
�
��
�
�
RL
RL
RLy
ystyLE
b7) limite de erro da estimativa sem considerar a variável auxiliar número de árvores
216
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Dado:
hakgn
y
y
n
i
i
/748718,2039
2,809
2
1
2
2
2
���
��
2
2
22
2
2
2)/(201580,0)
360
39360(
39
8167746296,8)(
)(ˆ)(ˆ hakg
N
nN
n
yVyV �
��
��
)/(448977,0201580,0)(ˆ)(22
hakgyVys ���
Então:
%3608,4100851783,20
448977,00253,2)()(
2
2
2��
�
�
�
�
y
ystyLE
S V
b8) eficiência da estimativa da média por regressão versus a da média sem considerar a variável auxiliar número de árvores
A eficiência é definida como o quociente entre o limite de erro sem considerar a variável auxiliar versus o valor obtido pelo método da regressão.
4762,19540,2
3608,4
)(
)(
2
2 ���RL
SV
yLE
yLEEf
O resultado do estrato II mostra que o limite de erro cor-respondente à análise sem considerar a variável auxiliar apre-senta um valor 47,62% superior ao encontrado pelo método por regressão, demonstrando ser este método mais eficiente que aquele.
c) estimativa por regressão para o estrato III
c1) produção média de sementes por regressão
217
Estimativa por regressão
Dado:
;23,4833
1
3��
�
n
i
iy ;0,2033
1
3��
�
n
i
ix ;27,623.23
1
33��
�
n
i
ii yx
;475,285.63
1
2
3��
�
n
i
iy ;0,161.11
2
3��
�i
ix ;248.13
1
3��
�
N
i
ix ;2403
�N
haárvoresN
x
X
N
i
i
/2,5240
248.1
3
1
3
3
3
���
��
3n
Então:
38
203161.1
38
23,483203.27,623.2
)(
))((
2
3
2
1
3
1
2
3
1 3
1
3
1
3
33
33
3
3
33
�
��
�
�
�
�
��
���
�
�
�
��
n
x
x
n
yx
yx
bn
i
in
i
i
n
i
n
i
i
n
i
i
ii
546088002,03 �b
hakgxXbyyRL
/63897697,12)38
2032,5(546088002,0
38
23,483)(
33333�������
c2) estimativa da variância de
38
203161.1
38
23,483203.27,623.2
)(
))((
2
3
2
1
3
1
2
3
1 3
1
3
1
3
33
33
3
3
33
�
��
�
�
�
�
��
���
�
�
�
��
n
x
x
n
yx
yx
bn
i
in
i
i
n
i
n
i
i
n
i
i
ii
546088002,03 �b
hakgxXbyyRL
/63897697,12)38
2032,5(546088002,0
38
23,483)(
33333�������
Dado:
��
��
���
�
�
�
�
��
�
��
�
�
3
3
3
3
33
3
1 3
1
2
32
3
1 3
1
2
32
3
2
3
1
3
1
3
1
33
2
3
]
)(
][
)(
[
]
))((
[
ˆ
n
i
n
i
i
i
n
i
n
ii
n
i
i
n
i
in
i
ii
n
y
yn
x
x
n
yx
yx
�
162549887,0
)38
23,483475,285.6)(
38
203161.1(
]38
23,48320327,623.2[
ˆ22
2
2
3 �
��
��
��
2
2
3
3
2
1
3
1
2
3
3 )/(795744737,337
38
23,483475,285.6
1
)(
)(ˆ
3
3
hakgn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
��
�
�
218
Amostragem em inventário florestal Waldenei Travassos de Queiroz�
��
�
���
�
�
�
�
��
�
��
�
�
3
3
3
3
33
3
1 3
1
2
32
3
1 3
1
2
32
3
2
3
1
3
1
3
1
33
2
3
]
)(
][
)(
[
]
))((
[
ˆ
n
i
n
i
i
i
n
i
n
ii
n
i
i
n
i
in
i
ii
n
y
yn
x
x
n
yx
yx
�
162549887,0
)38
23,483475,285.6)(
38
203161.1(
]38
23,48320327,623.2[
ˆ22
2
2
3 �
��
��
��
2
2
3
3
2
1
3
1
2
3
3 )/(795744737,337
38
23,483475,285.6
1
)(
)(ˆ
3
3
hakgn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
��
�
�
Então:
)162549887,01(795744737,338240
38240)ˆ1)((ˆ)()(ˆ 2
33
33
33
3���
�
���
�� �yV
nN
nNyV RL
22
33
33
33 )/(070406454,0)ˆ1)((ˆ)()(ˆ3
hakgyVnN
nNyV
RL��
�� �
hakgyVhays RLRL /265342146,0)(/)(33
��
�
c3) estimativa do total kgyNY RLRL 354473,033.363897697,12240ˆ333
����
222
3 757504,058.4070406454,0240)(ˆ)ˆ(ˆ33
kgyVNYV RLRL ����
kgYVYs RLRL 7083786,63)ˆ(ˆ)ˆ(33
��
e sua variância
kgyNY RLRL 354473,033.363897697,12240ˆ333
����
222
3 757504,058.4070406454,0240)(ˆ)ˆ(ˆ33
kgyVNYV RLRL ����
kgYVYs RLRL 7083786,63)ˆ(ˆ)ˆ(33
��kgyNY RLRL 354473,033.363897697,12240ˆ
333����
222
3 757504,058.4070406454,0240)(ˆ)ˆ(ˆ33
kgyVNYV RLRL ����
kgYVYs RLRL 7083786,63)ˆ(ˆ)ˆ(33
��
c4) intervalo de confiança do valor médio populacional 3Y
Limite inferiorhakgysty
RLRL/10099577,12265342146,00275,263897697,12)(
33
������
Limite superior hakgysty RLRL /17695817,13265342146,00275,263897697,12)(
33������ 12,63897697 + 2,0275 x 0,265342146 = 13,17695817 kg/ha
219
Estimativa por regressão
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato III encontra-se no in-tervalo de 12,10099577 kg/ ha a 13,17695817 kg/ ha.
c5) intervalo de confiança do valor total populacional 3Y
Limite inferior kgYstY RLRL 185735,904.27083786,630275,2354473,033.3)ˆ(ˆ
33������ 3.033,354473 – 2,0275 x 63,7083786 = 2.904,185735 kg
Limite superior kgYstY
RLRL523211,162.37083786,630275,2354473,033.3)ˆ(ˆ
33������ 3.033,354473 + 2,0275 x 63,7083786 = 3.162,523211 kg
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato III encontra-se no inter-valo de 2.904,185735 kg a 3.162,523211 kg.
c6) limite de erro da estimativa por regressão
%2565,410063897697,12
265342146,00275,2100
)()(
3
3
3��
�
��
�
�
RL
RL
RLy
ystyLE
c7) limite de erro da estimativa sem considerar a variável auxiliar número de árvores
Dado:
hakgn
y
y
n
i
i
/716579,1238
23,483
3
1
3
3
3
���
��
2
3
33
3
33 )/(084072416,0)
240
38240(
38
795744737,3)(
)(ˆ)(ˆ hakg
N
nN
n
yVyV �
��
��
)/(289952,0084072416,0)(ˆ)(33
hakgyVys ���
220
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Então:
c8) eficiência da estimativa da média por regressão versus a da média sem considerar a variável auxiliar número de árvores
A eficiência é definida como o quociente entre o limite de erro sem considerar a variável auxiliar versus o valor obtido pelo método da regressão.
0861,12565,4
6229,4
)(
)(
3
3 ���RL
SV
yLE
yLEEf
O resultado do estrato III mostra que o limite de erro corres-pondente à análise sem considerar a variável auxiliar apresenta um valor 8,61 % superior ao encontrado pelo método por regres-são, demonstrando ser este método mais eficiente que aquele.
2) efetuar a análise global para as estimativas por re-gressão considerando os estratos separadamente e compa-rar os resultados sem considerar a variável auxiliar número de árvores
a) valor médio global por regressão considerando separa-damente os estratos
Dado:
)( hhhhRL xXbyyh
���
Então:291782,30)(
11111���� xXbyy
RL
851783,20)( 22222���� xXbyyRL
638977,12)( 33333���� xXbyyRL
291782,30)(11111
���� xXbyyRL
851783,20)( 22222���� xXbyyRL
638977,12)( 33333���� xXbyyRL
221
Estimativa por regressão
291782,30)(11111
���� xXbyyRL
851783,20)( 22222���� xXbyyRL
638977,12)( 33333���� xXbyyRL
Portanto:
��
�L
i
RLhRL hSyWy
1
638977,12200.1
240851783,20
200.1
360291782,30
200.1
600�������
SRLy
hakgySRL
/929222,23�
b) valor total global por regressão considerando separada-mente os estratos
354473,033.364184,506.706929,175.18ˆˆ
1
���� ��
L
h
RLRL hSYY
kgYSRL
0656,715.28ˆ �
c) variância do valor médio global por regressão conside-rando os estratos separadamente
��
�L
I
RLhRL hSyVWyV
!
2)(ˆ)(ˆ
070406454,0)200.1
240(092499483,0)
200.1
360(106777788,0)
200.1
600()(ˆ 222 ������
SRLyV
2)/(03783566,0)(ˆ hakgyVS
RL�
)/(194514,003783566,0)(ˆ)( hakgyVysSS
RLRL ���
d) limite de erro considerando os estratos separadamente
%6257,1100929222,23
194514,000,2100
)(��
�
��
�
�
S
S
RL
RL
Sy
ystLE
222
Amostragem em inventário florestal Waldenei Travassos de Queiroz
e) limite de erro sem usar a variável auxiliar número de árvores
Dado:798681,23
38
23,483
200.1
240
39
2,809
200.1
360
40
46,1202
200.1
600
1
�������� ��
L
h
hhEstyWy
132336,0)(ˆ
1
2
���
L
h h
hh
n
yVW
0438,12)(ˆ
1
���
h
L
h
hyVW
0438,121200
1132336,0)(ˆ1)(ˆ
)(ˆ
1 1
2
����� � �� �
L
h
h
L
h
h
h
hh
EstyVW
Nn
yVWyV
2)/(122299,0)(ˆ hakgyV Est �
hakgyVys EstEst /349713,0122299,0)(ˆ)( ���
Então:
%9389,2100798681,23
349713,000,2100
)(��
�
��
�
�
Est
Est
RL
RL
SVy
ystLE
f) eficiência da estimativa da média por regressão com es-tratos separados
8078,16257,1
9389,2
)(
)(���
SRLS
EstSV
yLE
yLEEf
versus a calculada sem considerar a vari-ável auxiliar número de árvores
8078,16257,1
9389,2
)(
)(���
SRLS
EstSV
yLE
yLEEf
.
A eficiência é definida como o quociente entre o limite de erro da estimativa da média sem considerar a variável auxiliar número de árvores versus o calculado com estratos separados.
8078,16257,1
9389,2
)(
)(���
SRLS
EstSV
yLE
yLEEf
O resultado mostra que a análise com os estratos sepa-rados apresenta uma eficiência de 80,78% ao encontrado sem considerar a variável auxiliar número de árvores.
223
Estimativa por regressão
3) Análise global para as estimativas por regressão considerando os estratos conjuntamente, ou seja, a partir de Esty e Estx . comparar os resultados sem considerar a va-riável auxiliar número de árvores
a) coeficiente de regressão estimado considerando os es-tratos conjuntamente
Sabe-se que:
��
�
���
�
�
�
�
�
��
�
��
�
��
�
�
L
h h
n
i
hin
i
hi
hh
hh
L
h h
n
i
hi
n
i
hin
i
hihi
hh
hh
c
n
x
xnn
fW
n
yx
yxnn
fW
bh
h
hh
h
1
2
1
1
2
2
1
11
1
2
]}
)(
[)1(
)1({
]}
))((
[)1(
)1({
Dado que:
;460,202.11
1
1��
�
n
i
iy ;411
1
1
1��
�
n
i
ix ;2,624.12
1
1
11��
�
n
i
ii yx
;649,821.361
1
2
1��
�
n
i
iy �
�
�1
1
2
1369.4
n
i
ix
Seja:
321
321
CCC
AAAbc ++
++=
Tal que:
]
))((
[)1(
)1(
1
1
1
1
1
1
11
11
1
2
1
1
11
1
n
yx
yxnn
fWA
n
i
i
n
i
in
i
ii
���
��
�
��
��
224
Amostragem em inventário florestal Waldenei Travassos de Queiroz
0402236,0)40
46,202.14112,624.12(
3940
)600
401(5,0
2
1 �
�
�
�
�
�A
]
)(
[)1(
)1(
1
2
1
1
1
2
1
11
1
2
11
1
1
n
x
xnn
fWC
n
i
in
i
i
�� �
�
��
��
0218339,0)40
411369.4(
3940
)600
401(5,0 2
2
1 ��
�
�
�C
;2,8092
1
2��
�
n
i
iy ;3272
1
2��
�
n
i
ix ;8,987.62
1
22��
�
n
i
ii yx
;9,124.171
2
2��
�i
iy ;969.21
2
2��
�i
ix
]
))((
[)1(
)1(
2
1
2
1
2
1
22
22
2
2
2
2
22
2
n
yx
yxnn
fWA
n
i
i
n
i
in
i
ii
��� ��
�
��
��
0109907,0)39
)2,8093278,987.6(
3839
)360
391(3,0
2
2�
�
�
�
�
�A
]
)(
[)1(
)1(
2
2
1
2
1
2
2
22
2
2
2
2
2
2
n
x
xnn
fWC
n
i
in
i
i
�� �
�
��
��
0123045,0)39
327969.2(
3839
)360
391(3,0 2
2
2 ��
�
�
�C
;23,4833
1
3��
�
n
i
iy ;0,2033
1
3��
�
n
i
ix ;27,623.23
1
33��
�
n
i
ii yx
;475,285.63
1
2
3��
�
n
i
iy ;0,161.11
2
3��
�i
ix
2n 2n
3n
225
Estimativa por regressão
b) valor médio global por regressão considerando os estra-tos conjuntamente
Sabe-se que:
721306,838
203
200.1
240
39
327
200.1
360
40
411
200.1
600
1
�������� ��
L
h
hhEst xWx
798681,2338
23,483
200.1
240
39
2,809
200.1
360
40
46,1202
200.1
600
1
�������� ��
L
h
hhEstyWy
]
))((
[)1(
)1(
3
1
3
1
3
1
33
33
3
2
3
3
33
3
n
yx
yxnn
fWA
n
i
i
n
i
in
i
ii
��� ��
�
��
��
001001008,0)38
)23,48320327,623.2(
3738
)240
381(2,0 2
3�
��
�
�
�A
]
)(
[)1(
)1(
3
2
1
3
1
2
3
33
3
2
3
3
3
3
n
x
xnn
fWC
n
i
in
i
i
��
�
�
��
��
00183305,0)38
203161.1(
3738
)240
381(2,0 2
2
3 ���
�
�C
321
321
CCC
AAAbc
��
���
4515764,100183305,00123045,00218339,0
001001008,00109907,00402236,0�
��
���cb
haárvoresN
x
X
N
i
i
/79,8240360600
248.1060.3240.61�
��
����
��
226
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Então:
c) valor total global por regressão considerando os estratos conjuntamente
d) variância do valor médio global por regressão conside-rando os estratos conjuntamente
Dado que:
Sendo:
)( EstcEstRL xXbyyC
���
)721306,879,8(451576403,1798681,23 ���CRLy
hakgyCRL /898396,23�
kgyNYCC RLRL 0747,678.28898396,23200.1ˆ
�����
])(ˆ),(ˆ2)(ˆ[)1(
)(ˆ
1
2
2
��
���
�
L
hhchch
h
hh
RL xVbyxVbyVn
fWyV
C
321)(ˆ KKKyV
CRL
���
)](ˆ),(ˆ2)(ˆ[)1(
1
2
11
1
1
2
1
1 xVbyxVbyVn
fWK cc ��
�
�
)74295,34515764,189599,64515764,1227942,17(40
)600
401(5,0
2
2
1�����
�
�K
03001822,01 �K
)](ˆ),(ˆ2)(ˆ[)1(
2
2
22
2
2
2
2
2 xVbyxVbyVn
fWK cc ��
�
�
)97976,54515764,134130,54515764,1281677,8(39
)360
391(3,0
2
2
2�����
�
�K
01216087,02 �K
)](ˆ),(ˆ2)(ˆ[)1(
3
2
33
3
3
2
3
3 xVbyxVbyVn
fWK cc ��
�
�
)06899,24515764,112985,14515764,1279573,3(38
)240
381(2,0
2
2
3�����
�
�K
0043191834,03
�K
2
321 )/(046498273,0)(ˆ hakgKKKyVC
RL ����
hakgyVysCC RLRL /215635,0046498273,0)(ˆ)( ���
227
Estimativa por regressão
e) limite de erro considerando os estratos conjuntamente
f) eficiência da estimativa da média por regressão conside-rando os estratos conjuntamente ( )( EstcEstRL xXbyy
C���
)721306,879,8(451576403,1798681,23 ���CRLy
hakgyCRL /898396,23�
) versus a calculada sem considerar a variável auxiliar
A eficiência é definida como o quociente entre o limite de erro da estimativa da média sem considerar a variável auxiliar número de árvores versus o calculado considerando os estratos conjuntamente.
6286,18046,1
9389,2
)(
)(���
CRL
EstSV
yLE
yLEEf
)](ˆ),(ˆ2)(ˆ[)1(
1
2
11
1
1
2
1
1 xVbyxVbyVn
fWK cc ��
�
�
)74295,34515764,189599,64515764,1227942,17(40
)600
401(5,0
2
2
1�����
�
�K
03001822,01 �K
)](ˆ),(ˆ2)(ˆ[)1(
2
2
22
2
2
2
2
2 xVbyxVbyVn
fWK cc ��
�
�
)97976,54515764,134130,54515764,1281677,8(39
)360
391(3,0
2
2
2�����
�
�K
01216087,02 �K
)](ˆ),(ˆ2)(ˆ[)1(
3
2
33
3
3
2
3
3 xVbyxVbyVn
fWK cc ��
�
�
)06899,24515764,112985,14515764,1279573,3(38
)240
381(2,0
2
2
3�����
�
�K
0043191834,03
�K
2
321 )/(046498273,0)(ˆ hakgKKKyVC
RL ����
hakgyVysCC RLRL /215635,0046498273,0)(ˆ)( ���
%8046,1100898396,23
215635,000,2100
)(��
���
�
�
C
C
RL
RL
Cy
ystLE
228
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Sendo:
O resultado mostra que a análise considerando os estratos conjuntamente (função de Esty e Estx ) apresenta uma eficiência de 62,86% ao encontrado sem considerar a variável auxiliar nú-mero de árvores.
4) comparar os resultados das estimativas por regres-são considerando os estratos separadamente ( )( EstcEstRL xXbyy
C���
)721306,879,8(451576403,1798681,23 ���CRLy
hakgyCRL /898396,23�
) versus usando os estratos conjuntamente ( )( EstcEstRL xXbyy
C���
)721306,879,8(451576403,1798681,23 ���CRLy
hakgyCRL /898396,23�
)
A eficiência é definida como o quociente entre o limite de erro da estimativa da média por regressão obtida com os estra-tos conjuntamente )( EstcEstRL xXbyy
C���
)721306,879,8(451576403,1798681,23 ���CRLy
hakgyCRL /898396,23�
versus o calculado com estratos sepa-rados )( EstcEstRL xXbyy
C���
)721306,879,8(451576403,1798681,23 ���CRLy
hakgyCRL /898396,23�
.
O resultado mostra que a análise com os estratos sepa-rados apresenta uma eficiência 8,61% superior ao encontrado pelo método por regressão que considera os estratos conjunta-mente (função de Esty e Estx ).
É importante ressaltar que os resultados deste exemplo revelaram uma grande vantagem quanto ao uso da estimativa por regressão em relação à análise sem considerar a variável auxiliar número de árvores.
Por outro lado, o uso da estimativa pela regressão na amos-tragem estratificada com os estratos separados é recomendado quando existe variação entre os verdadeiros coeficientes de re-
%9389,2100798681,23
349713,000,2100
)(��
�
��
�
�
Est
Est
RL
RL
SVy
ystLE
0861,16257,1
8046,1
)(
)(���
S
C
RLS
RLC
yLE
yLEEf
229
Estimativa por regressão
gressão, enquanto que a análise em função de Esty e Estx deve ser aplicada quando esses coeficientes forem homogêneos.
Os valores encontrados para os coeficientes de regres-são para os três estratos apresentaram certa variabilidade ( ;842257,11 =b ;893230,0ˆ
2 =b 546088,03 =b ), o que resultou em uma eficiência de 8,61 % para o método de regressão com os estratos separados em relação ao obtido com a análise conjunta dos estratos (função de Esty e Estx ).
cApítulo 9
AmostrAgem por conglomerAdo
Define a amostragem por conglomerados, descrevendo os parâmetros populacionais e os seus estimadores. Apresenta as metodologias referentes aos conglomerados em estágio único, em dois estágios e também em três estágios. Apresenta a teoria sobre a amostragem por conglomerados em estágio único e em dois estágios com unidades de grandezas iguais e desiguais, estendendo esta concepção quando ocorrer proporções. Mostra a obtenção dos componentes de variâncias no modelo inteira-mente ao acaso através do método dos momentos ou da análise de variância. Discorre sobre a ocorrência de estimativa negativa do componente de variância entre conglomerados. Apresenta a análise de conglomerados em dois estágios considerando a ocorrência de tipologias diferentes na subparcela, assim como quando ocorrer uma variável auxiliar. Mostra exemplos aplicati-vos sobre todos os temas abordados.
233
Amostragem por conglomerado
A amostragem por conglomerados ou grupos é uma va-riação de qualquer processo de amostragem que, em vez de utilizar unidades de amostra individuais, usa um grupo ou con-glomerado de pequenas subparcelas. As subparcelas também são denominadas subunidades ou unidades secundárias.
Quando os conglomerados são selecionados aleatoria-mente na floresta, pode-se definir que a amostragem consiste em reunir em grupos as subparcelas que em uma amostra intei-ramente aleatória se dispersariam na floresta. Dessa forma, as subparcelas se restringem a uma área específica denominada subpopulação. Esse procedimento torna o trabalho de campo mais flexível, sem deixar de permitir a determinação da estimati-va da variância da média para o inventário florestal.
A amostragem por conglomerados apresenta uma impor-tante vantagem que é a sensível redução dos custos, visto que custa mais efetuar a medição de unidades amostrais distribuí-das esparsamente na floresta que medir o equivalente quando as unidades estão reunidas em subpopulações.
Por outro lado, nos inventários nos trópicos, quando as subparcelas do conglomerado são definidas sistematicamente e dimensionadas de tal forma que um conglomerado seja medido em um dia de trabalho, o custo de medição de campo será sen-sivelmente reduzido. Entretanto, o cálculo do erro de amostra-gem sofre uma pequena tendência, pois, apesar dos conglome-rados serem selecionados inteiramente ao acaso, tem-se que as subparcelas são tomadas sistematicamente.
A tendência no cálculo da variância da média pode ser considerada desprezível no caso de inventários florestais, pois, normalmente, os valores das variáveis respostas são ordenados aleatoriamente por algum critério objetivo ou mesmo se suce-dem numa ordem natural, podendo-se, assim, através da análi-
234
Amostragem em inventário florestal Waldenei Travassos de Queiroz
se de variância, ter uma aproximação satisfatória da estimativa da variância da população.
A amostragem por conglomerados, no que se refere à apli-cação em levantamentos florestais, apresenta as seguintes van-tagens:
a) oferece melhor controle no trabalho de campo, pois as unidades de registro – subparcelas do conglomerado - são me-nores;
b) percepção de maior quantidade de variabilidade da va-riável resposta em questão, pois o conglomerado é formado por uma série de subparcelas, as quais explicam a variabilidade dentro do conglomerado;
c) em florestas tropicais, onde a acessibilidade é difícil, é vantajosa a aplicação da amostragem por conglomerados, prin-cipalmente quando apresenta uma forma estrutural para ser completamente mensurada no expediente de um dia de trabalho.
Freese (1962) cita que em inventários realizados em áre-as de difícil acesso, onde o custo de localização da unidade de amostra é alto, o uso da amostragem por conglomerados em dois estágios possibilita a redução do custo do levantamento, pois em cada conglomerado amostrado são medidas várias subparcelas.
Loetsch e Haller (1964) citam que, em razão da concentra-ção das subparcelas na amostra por conglomerado apresentar uma diminuição das distâncias a serem percorridas em relação à amostra aleatória, haverá uma substancial vantagem opera-cional e financeira.
A amostragem por conglomerados é classificada, de acor-do com a tomada das subparcelas, em:
a) amostragem por conglomerados em estágio único: quan-do são levantadas todas as subparcelas;
235
Amostragem por conglomerado
b) amostragem por conglomerados em dois estágios: quan-do ocorre subamostragem para seleção das subparcelas;
c) amostragem por conglomerados em três estágios: quan-do ocorre subamostragem de conglomerados e também suba-mostragem de subparcelas. A amostragem por conglomerados pode evoluir para mais estágios.
9.1 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO
A amostragem por conglomerados em estágio único é de-finida quando em cada unidade primária selecionada são medi-das todas as M subparcelas. As subparcelas também podem ser denominadas como unidades secundárias ou subunidades.
9.1.1 parâmetros populacionais e estimadores
Para formulação dos parâmetros populacionais e seus es-timadores, será considerado que a área total da população é dividida em N unidades primárias ou conglomerados, das quais serão selecionadas n primárias. Será considerado que cada uni-dade primária contém o mesmo número M de subparcelas.
a) valor médio por conglomerado e por subparcela
A notação que será usada é uma extensão natural daquela que já vem sendo utilizada. O índice inferior i indica o conglo-merado e o j a subparcela dentro do conglomerado.
ijy = valor da variável resposta correspondente à j-ésima subparcela correspondente ao i-ésimo conglomerado;
.iy = valor total das subparcelas para o i-ésimo conglome-rado;
236
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Y = valor médio populacional considerando os conglome-rados;
iY = valor médio populacional por subparcela para o i-ési-mo conglomerado;
Y = valor médio populacional considerando todas as subparcelas;
iy = valor médio estimado por subparcela para o i-ésimo conglomerado;
y = valor médio estimado considerando todas as subparcelas;Y = valor total populacional; Y = valor total estimado.
Daí:
;1
.
N
y
Y
N
i
i��
� ;1
.
M
Y
NM
y
Y
N
i
i
��
�� ;
1
.
n
y
y
n
i
i��
�M
y
nM
y
y
n
i
i
��
��1
.
b) valor total Y e seu estimador Y
;YNMYNY �� yNMyNY ��ˆ
c) variância populacional e seus estimadores
)(1 yV = variância populacional para os valores totais dos conglomerados;
)(yV = variância populacional considerando os valores das subparcelas;
MyVyVb )()( 1= é variância dos conglomerados com base nas subparcelas;
)(yVw = variância média das subparcelas dentro dos con-glomerados;
237
Amostragem por conglomerado
)(yV = variância populacional da média dos conglomerados;)(yV = variância populacional da média das subparcelas;)(1 yV = variância estimada dos conglomerados; )(ˆ yV = variância estimada das subparcelas;
MyVyVb )(ˆ)(ˆ1= é a variância estimada dos conglomera-
dos com base nas subparcelas ou unidades secundárias;)(ˆ yVw = variância média estimada considerando as subpar-
celas dentro dos conglomerados;)(ˆ yV = variância estimada da média dos conglomerados;)(ˆ yV = variância estimada da média das subparcelas.
A Tabela 9.1 apresenta a análise de variância com base nas subparcelas, admitindo que os conglomerados foram sele-cionados através de uma amostra simples ao acaso:
238
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 9.1 - Análise de variância com base nas subparcelas.
CAUSAS DE VARIAÇÃO GL QM
Entre Conglomerados
Dentro dos Conglomerados
N-1
N(M-1)
)(yVQM bEntre �)( yVQM wDe ntro �
)(yVQM bEntre �)( yVQM wDe ntro �
T O T A L NM-11.
)()1()()1(
�
����
MN
yVMNyVNQM wb
Total
Sendo:
1
)(ˆ)1()(ˆ)1()(ˆ
�
���
�
nM
yVMnyVnyV wb (9.1)
A estimativa da variância a partir das subparcelas, Expres-são 9.1, tem uma pequena tendência porque as subparcelas não fazem parte de uma amostra simples ao acaso dentro das unidades primárias ou conglomerados. As subparcelas são sele-cionadas em grupos contíguos. Essa tendência é praticamente desprezível se o número de conglomerados for maior que 50.
A Expressão 9.1 pode ser escrita na forma simplificada 9.2.
M
yVMyVyV wb )(ˆ)1()(ˆ)(ˆ −+
= (9.2)
A partir da teoria da análise de variância, tem-se:
n
yMV
N
nN
n
yV
N
nNyV b )(
)()(
)()( 1 �
�
�
�
Tal que:
n
yVM
N
nN
n
yV
N
nNyV b )(ˆ
)()(ˆ
)()(ˆ 1 −=
−=
239
Amostragem por conglomerado
Portanto:
)(1
)()(2
yVMM
yVyV ==
Então:
)(ˆ1)(ˆ)(ˆ
2yV
MM
yVyV ==
Expandindo-se para o total da população, resulta:
)(ˆ)(ˆ)ˆ(ˆ 2 yVNyNVYV ==
A variância do valor médio por subparcela )(yV também pode ser expressa em função do coeficiente de correlação intra-conglomerado (d). Este coeficiente mede o grau de dependência entre as subparcelas dentro do conglomerado, sendo definido pela fórmula de Pearson:
2)(
))((
yyE
yyyyE
ij
ikij
�
����
Desenvolvendo-se, resulta:
)()1)(1(
))((2
)(
))(( 1
2yVNMM
YyYy
yyE
yyyyE
N
i
ik
M
kj
ij
ij
ikij
��
��
��
���
��� �
� (9.3)
Conforme Cochran (1977), a Expressão 9.3 pode ser escri-ta na forma 9.4:
)()1)(1(
)()1()1(
yVMNM
yVNMQMMN Entre
��
������ (9.4)
240
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Que sob a condição )1()1( ��� NMMN , tem-se:
)()1(
)(
yVM
yVQM Entre
�
���
Quanto maior o coeficiente de correlação intraconglome-
rado mais homogêneas são as subparcelas dentro dos conglo-merados e menos eficiente é a aplicação da amostragem por conglomerados.
Seja uma amostra inteiramente ao acaso de n de conglo-merados de uma população de tamanho N, cada um dos quais possuindo M subparcelas. O valor médio amostral por subpar-cela ( y ) é uma estimativa sem tendência de Y e sua variância é dada pela expressão:
)]1(1[)1(
)()1()
1()(
2��
�
��
�� M
NM
yVNM
n
fyV � (9.5)
Sendo:
1
)(
)(1
2
1
�
�
�
��� �
NM
Yy
yV
N
i
M
j
ij
Tomando-se NM-1 = NM e N-1 = N, a Expressão 9.5 pode ser simplificada para:
Destarte:
)]1(ˆ1)[(ˆ)1
()(ˆ ����
� MyVnM
fyV �
)]1(1)[()1
()( ����
� MyVnM
fyV �
241
Amostragem por conglomerado
9.2 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO COM UNIDADES DE GRANDEzAS DESIGUAIS
Seja uma amostra por conglomerado em estágio único, para o caso mais geral, onde cada conglomerado seja constituí-do por Mi unidades secundárias.
9.2.1 parâmetros populacionais e estimadores
O valor médio populacional por subparcelas é dado, por:
0
1
1
1.
M
yM
M
yY
N
iii
N
ii
N
ii ∑
∑
∑=
=
= ==
Dado que:
∑=
=N
iiMM
10
Para estimar o valor médio por subparcela (Y ) existem três procedimentos:
1) Ignorando a variação de tamanho entre os conglo-merados
a) valor médio estimado
b) variância da média estimada
n
yy
n
ii∑
== 11
0
1
1
1
.
M
yM
M
y
Y
N
i
ii
N
i
i
N
i
i �
�
��
�
� ��
242
Amostragem em inventário florestal Waldenei Travassos de Queiroz
c) valor total estimado e sua variância
O valor total estimado é 101 yMY = e sua variância será
igual a )(ˆ)ˆ(ˆ1
201 yVMYV = .
Este procedimento gera uma estimativa tendenciosa e de pequena precisão, principalmente quando os valores de Mi va-riam muito e as médias dos conglomerados
iy apresentam pe-quena variação.
2) proceder a uma estimativa por razão, onde os Mi consti-tuem a variável auxiliar
a) valor médio por razão estimado por subparcela
n
nn
ii
n
ii
R M
y
M
yy ==
∑
∑
=
=
1
1.
Tendo-se:
;1
.
n
yy
n
ii
n
∑==
.1
n
MM
n
ii
n
∑==
b) variância da média estimada por razão por subparcela
Da teoria da estimativa por razão, tem-se:
212
1
12
1
1 ))(
(])(
[)()(N
n
iii
n
Ii
n
iii
n
ii
n
iii
RMn
YyM
E
M
YyM
EY
M
yM
EyV∑
∑
∑
∑
∑=
=
=
=
=
−≅
−=−=
243
Amostragem por conglomerado
Então:
)1
2)(
)((1
)(ˆ 1
22
1
2
1
2
2�
���
�
������
n
MyyMyyM
nN
nN
MyV
n
i
iR
n
i
iiR
n
i
ii
N
R
Tal que:
∑=
=N
iiN M
NM
1
1
c) valor total estimado por razão e sua variância
O valor total estimado é RR yMY 0ˆ = , então sua variância
será igual a )(ˆ)ˆ(ˆ 20 RR yVMYV = .
3) obter as estimativas se conhecidos os tamanhos dos conglomerados da população
a) valor médio estimado
0
1.
3 Mf
yy
n
ii
×=∑
=
Sendo:
;1
0 ∑=
=N
iiMM
N
nf =
b) variância da média estimada
n
yV
N
nN
MyV
N
)(ˆ)(
1)(ˆ 1
23
−= , tal que:
1
)(
)(ˆ
2
1.
1
2.
1 −
−=
∑∑ =
=
nn
yy
yV
n
iin
ii
244
Amostragem em inventário florestal Waldenei Travassos de Queiroz
c) valor total estimado e sua variância
O valor total estimado é ,ˆ303 yMY = então sua variância
será igual a ).(ˆ)ˆ(ˆ3
203 yVMYV = ).
Dentre os procedimentos apresentados, destaca-se que o segundo procedimento, estimativa por razão, é o melhor sob o ponto de vista teórico.
exercício 9.1
Seja uma floresta de 1.000 ha dividida em 100 áreas de observações fenológicas de dez hectares (unidades primárias ou conglomerados). Cada uma subdividida em cinco unidades secundárias ou subparcelas de dois hectares. Considerar uma amostra de dez conglomerados (C) e efetuar a análise estatísti-ca. A Tabela 9.2 apresenta a produção de sementes por subpar-cela (kg / 2 ha) para uma determinada espécie (dados fictícios).
tabela 9.2 - Produção de sementes por subparcela (dados fictícios) kg/2 ha.
C S1 S2 S3 S4 S5 Totais ( .iy ) )(ˆ yVwi
1 11,0 12,7 12,0 11,1 10,7 57,5 0,6852 9,6 10,5 8,0 9,8 8,0 45,9 1,2723 14,1 11,6 12,6 13,2 12,5 64,0 0,8554 15,4 12,8 14,1 13,0 14,0 69,3 1,0785 10,0 11,0 10,9 12,6 12,1 56,6 1,0676 13,0 14,0 12,9 13,9 12,8 66,6 0,3377 12,1 10,8 12,0 12,6 12,9 60,4 0,6478 13,5 14,4 15,1 16,0 15,9 74,9 1,1079 12,3 14,0 13,2 12,3 11,5 63,3 0,923
10 14,4 15,5 17,0 15,3 15,0 78,2 1,163Total 636,7 9,134
Tem-se que: ;7,636
1
.��
�
n
i
iy ;97,330.41
1
2
.��
�
n
i
iy 73,83021 1
2
��� �
�
n
i
M
j
ijy
245
Amostragem por conglomerado
a) valor médio estimado por subparcela
hakgnM
y
y
n
i
M
j
ij
2/734,12510
7,6361 1�
���
��� �
b) variância da média estimada
Dado que:
2
2
2
1
.
1
2
.
1 )10/(031222,889
10
7,63697,330.41
1
)(
)(ˆ hakgn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
�� �
�
2
2
1 1
1 1
2
2
)2/(979432653,349
50
7,63673,8302
1
)(
)(ˆ hakgnM
nM
y
y
yV
n
i
M
i
n
i
M
j
ij
ij
�
�
��
�
�
����
� �
� �
2
11
2
.
1
2
)2/(9134,010
134,9)(ˆ1
1
1)(ˆ hakgyV
nM
M
yy
nyV
n
i
wi
n
i
iM
j
ij
w ����
�
� ���
��
�
Então:21 )10/(9227,7
10
032222,88)
100
10100(
)(ˆ)()(ˆ hakg
n
yV
N
nNyV �
�
�
�
�
Ou, pela fórmula:2)10/(9227,7
10
606,175)
100
10100(
)(ˆ)()(ˆ hakg
n
yVM
N
nNyV b
�
��
�
�
�
Por conseguinte:
246
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Outra maneira de obter a variância do valor médio por subparcela ou subunidade )(ˆ yV é em função do coeficiente de correlação intraconglomerado. A estimativa do coeficiente de correlação intraconglomerado ( d ) entre as subparcelas de um mesmo conglomerado é dada pela fórmula:
Seja, Tabela 9.3, a análise de variância dos dados:
tabela 9.3 - Análise de variância.
CV GL SQ QM
Entre 9 158,4562 17,6062444
Dentro 40 36,536 0,9134
Total 49 194,9922 3,979432653
Então:
Logo:
)(ˆ)1)(1(
)(ˆ)1()ˆ()1(ˆ
yVMnM
yVnMMQMn Entre
��
�����
247
Amostragem por conglomerado
c) intervalo de confiança do valor médio populacional por subparcela (Y )
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 5,7981 kg/ ha a 6,935889 kg/ ha.
d) intervalo de confiança para o valor total populacional (Y)
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 5.798,11 kg a 6.935,89 kg.
e) limite de erro da estimativa do valor médio por subparcela
hakgnM
y
y
n
i
M
j
ij
2/734,12510
7,6361 1�
���
��� �
562949,00211,2734,12)(: ����� ystyIC
hakgYhaIC 2/8718,132/5962,11: ��
hakgYhakgIC /935889,6/7981,5: ��
22222 99975,228.79316915999,05100)2/(ˆ)ˆ(ˆ kghayVMNYV �������
kgYs 4764639,281)ˆ( �
4764639,2810211,26367)ˆ(ˆ: ����� YstYIC
kgYkgIC 89,935.611,798.5: ��
kghayMNY 367.6734,1251002/ˆ �������
%97,81002/734,12
2/564942466,00211,2100
)(% ��
�
��
�
�
ha
ha
y
ystLE
248
Amostragem em inventário florestal Waldenei Travassos de Queiroz
exercício 9.2
Seja uma área florestal de 1.000 ha dividida em N = 80 áreas de observações fenológicas com grandezas desiguais (unidades primárias ou conglomerados). Cada uma subdividida em unida-des secundárias ou subparcelas de um hectare. Considerar uma amostra de dez conglomerados (C) e efetuar a análise estatística. A Tabela 9.4 apresenta a produção de sementes por conglomera-do (kg/ha) para uma determinada espécie (dados fictícios).
tabela 9.4 - Produção de sementes (kg/ha).
C iM Totais ( .iy ) iy
1 17 479,4 28,2
2 11 256,3 23,3
3 10 328,0 32,8
4 14 464,8 33,2
5 15 495,0 33,0
6 13 413,4 31,8
7 10 308,0 30,8
8 13 372,6 28,7
9 9 294,3 32,7
10 8 311,2 38,9
Total 120 3723,0 313,4
1) Ignorando a variação de tamanho entre os conglo-merados
Sabe-se que:
249
Amostragem por conglomerado
a) valor médio estimado
b) variância da média estimada
c) valor total estimado
d) variância estimada do valor total
e) intervalo de confiança do valor médio populacional por subparcela (Y )
Pode-se afirmar, com uma probabilidade de acerto de
95%, que o valor médio populacional encontra-se no intervalo de 28,9784 kg/ ha a 33,7016 kg/ ha.
hakgn
y
y
n
i
i
/34,3110
4,3131
1 ���
��
9
10
4,31328,971.9
)1080
1080(
1
)(
)()(ˆ
2
2
1
1
2
1
�
�
��
�
��
�
��
�
�
n
n
y
y
Nn
nNyV
n
i
in
i
i
2
1)/(451761111,1)(ˆ hakgyV �
hakgys /204890,1)( 1 �
kgyMY 0,3134034,311000ˆ101
����
222
011111,1451761451761111,11000)(ˆ)ˆ(ˆ kgyVMYV
R����
kgYs 1505,775.3)ˆ(1
�
204890,196,134,31)(: 11 ����� ystyIC
hakgYhakgIC /7016,33/9784,28: ��
250
Amostragem em inventário florestal Waldenei Travassos de Queiroz
f) intervalo de confiança do valor total populacional (Y )
Pode-se afirmar, com uma probabilidade de acerto de
95%, que o valor total populacional encontra-se no intervalo de 23.940,7050 kg a 38.739,2950 kg.
g) limite de erro da estimativa do valor médio por subparcela
Este procedimento gera uma estimativa tendenciosa e de pequena precisão, principalmente quando os valores de Mi va-riam muito e as médias dos conglomerados iy apresentam pe-quena variação.
2) proceder a estimativa por razão, onde os iM consti-tuem a variável auxiliar
a) valor médio estimado por razão
b) variância do valor médio por razão estimado
1505,377596,10,340.31)ˆ(ˆ: 11 ����� YstYIC
kgYkgIC 2950,739.387050,940.23: ��
%54,710034,31
204890,196,1100
)(%
1
1��
���
��
y
ystLE
hakg
M
y
yn
i
i
n
i
i
R/025,31
120
0,3723
1
1
.
���
�
�
�
�
)1
2)(
)((1
)(ˆ 1
22
1
2
1
2
2 �
���
�
������
n
MyyMyyM
nN
nN
MyV
n
i
iR
n
i
iiR
n
i
ii
N
R
)9
1514025,310,624.46025,3122,587.452.1)(
8010
1080(
5,12
1)(ˆ
2
2
�����
�
��
RyV
2)/(049667,1)(ˆ hakgyV R �
hakgys R /024533,1)( �
251
Amostragem por conglomerado
Tendo:
c) valor total estimado por razão
d) variância estimada do valor total por razão
Destarte:
e) intervalo de confiança do valor médio populacional por subparcela (Y )
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 29,016915 kg/ ha a 33,033085 kg/ ha.
)1
2)(
)((1
)(ˆ 1
22
1
2
1
2
2 �
���
�
������
n
MyyMyyM
nN
nN
MyV
n
i
iR
n
i
iiR
n
i
ii
N
R
)9
1514025,310,624.46025,3122,587.452.1)(
8010
1080(
5,12
1)(ˆ
2
2
�����
�
��
RyV
2)/(049667,1)(ˆ hakgyV R �
hakgys R /024533,1)( �
5,1280
10001
1
��� ��
N
i
iNM
NM
kgYR 0,025.31025,311000ˆ���
220,667.049.1049667,11000)ˆ(ˆ kgYV R ���
kgYs R 532576,1024)ˆ( �
024533,196,1025,31)(: ����� RR ystyIC
hakgYhakgIC /033085,33/016915,29: ��
252
Amostragem em inventário florestal Waldenei Travassos de Queiroz
f) intervalo de confiança do valor total populacional (Y )
Pode-se afirmar, com uma probabilidade de acerto de
95%, que o valor total populacional encontra-se no intervalo de 29.016,915 kg a 33.033,085 kg.
g) limite de erro da estimativa do valor médio por razão
3) obter as estimativas se conhecidos os tamanhos dos conglomerados da população
a) valor médio estimado
Dado que 125,080
10 ���N
nf , então:
b) variância estimada do valor médio
Dado que:
532576,102496,10,025.31)ˆ(ˆ: ����� RR YstYIC
kgYkgIC 085,033.33915,016.29: ��
%47,6100025,31
024533,196,1100
)(% ��
�
��
�
�
R
R
y
ystLE
hakgMf
y
y
n
i
i
/784,291000125,0
0,3723
.0
1
.
3�
���
��
2
2
2
1
.
1
2
.
1)/(044444,7349
9
10
0,37233,214.452.1
1
)(
)(ˆ hakgn
n
y
y
yV
n
i
in
i
i
�
�
��
�
�
��
�
�
253
Amostragem por conglomerado
Então:
c) valor total estimado
d) variância estimada do valor total
e) intervalo de confiança para o valor médio por subparcela (Y )
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 25,807824 kg/ ha a 33,760176 kg/ ha.
f) intervalo de confiança para o valor total (Y )
10
0444444,7349)
80
1080(
5,12
1)(ˆ)(
1)(ˆ
2
1
23
�
�
�
�
n
yV
N
nN
MyV
N
2
3)/(115464889,4)(ˆ hakgyV �
hakgys /028660861,2)( 3 �
kgyMY 0,784.29784,291000ˆ303
����
22
3
2
03 889,464.115.4115464889,41000)(ˆ)ˆ(ˆ kgyVMYV ����
kgYs 660861,028.2)ˆ( 3 �
028661,296,1784,29)(: 33 ����� ystyIC
hakgYhakgIC /760176,33/807824,25: ��
660861,202896,10,29784)ˆ(ˆ: 33 ����� YstYIC
kgYkgIC 17529,760.3382471,807.25: ��
254
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 25.807,82471 kg a 33.760,17529 kg.
g) limite de erro da estimativa do valor médio por unidade secundária
Dentre os procedimentos apresentados, destaca-se que o segundo, estimativa por razão, é o melhor sob o ponto de vista teórico da estatística.
9.3 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO PELAS PROPORçõES
Seja um inventário florestal composto por n conglomerados estruturados com m subparcelas, as quais podem ser classi-ficadas em duas categorias: C1 e C0. Admitindo que qualquer subparcela do conglomerado pertença a uma das duas catego-rias, C1 e C0, onde C1 corresponde às subparcelas que possuem o atributo desejado e C0 definem os dados que não o possuem.
Seja a seguinte notação:ia = número de subparcelas pertencente à categoria C1 no
conglomerado de ordem i ;N = número total de conglomerados da população;n = número de conglomerados amostrado;M = número de subparcelas por conglomerado;
Map ii /= é proporção de subparcelas pertencentes à cate-goria C1 no conglomerado de ordem .i
%35,13100784,29
028661,296,1100
)(%
3
3��
�
��
�
�
y
ystLE
255
Amostragem por conglomerado
9.3.1 valores populacionais e estimadores
a) proporção estimada
Para quantificar os resultados, seja a seguinte regra para qualquer subparcela yij da amostra ou da população:
yij = 1, se yij estiver contido em C1;yij = 0, se yij estiver contido em C0.
Para a amostra de valores yij , resulta que:
∑=
=M
jiij ay
1
yij = ai
Daí, para o conglomerado de ordem i, tem-se:
M
a
M
yp ii
i ==
ip : é a proporção de subparcelas do conglomerado i per-tencente à categoria C1.
b) variância da proporção
Considerando uma amostra aleatória de n conglomerados, define-se como valor de p, a média das observações pi obtidas na amostra, tal que p é uma estimativa da proporção P popula-cional. Então:
Dado que Map ii /= , logo: ��
�
���
n
i
n
i
i
inM
a
pn
p1
11 . Então:
n
yV
N
nNpV
)()()(
−= , para
1
)(
1
)()( 1
2
12
1
2
−
−=
−
−=
∑∑
∑=
=
=
NN
pp
N
PpyV
N
I
N
Ii
i
N
ii
256
Amostragem em inventário florestal Waldenei Travassos de Queiroz
∑=
=N
iip
NP
1
1
Resultando:
n
yV
N
nNpV
)(ˆ)()(ˆ −
= , para .1
)(
1
)()(ˆ 1
2
12
1
2
−
−=
−
−=
∑∑
∑=
=
=
nn
pp
n
ppyV
n
I
n
Ii
i
n
ii
No caso de ocorrer variação no tamanho do conglomerado, então p é uma estimativa por razão, ou seja:
iii Map /= , logo:
∑
∑
∑
∑
=
=
=
= ==n
Ii
n
iii
n
ii
n
ii
M
pM
M
ap
1
1
1
1
Por conseguinte, a estimativa da variância é dada pela ex-pressão:
1
2
)(1
)(ˆ 1 1 1
222
2 �
���
�
� � �� � �
n
MpMapa
nN
nN
MpV
n
i
n
i
n
i
iiii
N
Sendo:
N
MM
n
ii
N
∑== 1
exercício 9.3
Seja um inventário florestal com 40 conglomerados selecio-nados em uma área de 7.200 ha. O objetivo é conhecer a ocorrên-cia de cipós. A estrutura conglomerada usada é constituída por oito subparcelas de 1 ha. Os dados estão apresentados na Tabela 9.5.
Sabe-se que:
257
Amostragem por conglomerado
área = 7.200 ha.área do conglomerado ou unidade primária = 8 ha.Número de conglomerados amostrados ( n =40).Número de total de conglomerados ( 9008/200.7 ==N ).Número de subparcelas por conglomerados ( 8=M ).
tabela 9.5 - Número de subparcelas (ai) por conglomerado (C) com ocor-rência de cipós.
C ai pi = ai /8 C ai pi = ai /8 C ai pi = ai /8 C ai pi = ai /8
1 0 0,000 11 0 0,000 21 1 0,125 31 0 0,000
2 3 0,375 12 1 0,125 22 2 0,250 32 1 0,125
3 1 0,125 13 5 0,625 23 1 0,125 33 2 0,250
4 3 0,375 14 3 0,375 24 2 0,250 34 0 0,000
5 2 0,250 15 2 0,250 25 4 0,500 35 0 0,000
6 1 0,125 16 1 0,125 26 2 0,250 36 4 0,500
7 2 0,250 17 3 0,375 27 3 0,375 37 1 0,125
8 4 0,500 18 0 0,000 28 2 0,250 38 1 0,125
9 1 0,125 19 3 0,375 29 4 0,500 39 0 0,000
10 0 0,000 20 0 0,000 30 0 0,000 40 2 0,250
a) proporção estimada
Sendo:
;3750,81
���
n
i
ip 0,671
��
�n
i
ia
Então:
209375,040
3750,81 ���
��
n
p
p
n
i
i
Ou,
209375,0840
0,671 ��
��
��
nM
a
p
n
i
i
258
Amostragem em inventário florestal Waldenei Travassos de Queiroz
b) variância da proporção estimada
Dado que:
030759,039
40
3750,89531,2
1
)(
)(ˆ
2
1
2
12
�
�
��
�
�
��
�
�
n
n
p
p
yV
n
I
n
I
i
i
Então:
0007535955,040
030759,0
2000
402000)(ˆ)()(ˆ ��
��
��
n
yV
N
nNpV
027452,0)(ˆ)( �� pVps
c) intervalo de confiança para a proporção 027452,00211,2209375,0 ���IC
264858,0153892,0 �� P
Pode-se afirmar, com uma probabilidade de acerto de 95%, que a porcentagem populacional de ocorrência de cipós encon-tra-se no intervalo de 15,39% a 26,49%.
d) ocorrência e intervalo de confiança para o total de subparcelas
d1) total estimado de subparcelas com ocorrência de cipós209375,09008ˆ
���� MNpA = 1507,5 subparcelas
d2) intervalo de confiança para o total de subparcelas com ocorrência de cipós
)264858,0153892,0(200.7 ��� AIC
ssubparcelaAssubparcelaIC 9776,906.10224,108.1 ���
259
Amostragem por conglomerado
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o total populacional de subparcelas com ocorrência de ci-pós encontra-se no intervalo de 1.108,024 a 1.906,9776.
exercício 9.4
Seja uma população constituída de 200 comunidades (CO) e localizada em uma área florestal com vocação para produção de castanha do brasil, tal que foram selecionadas 30 delas. Em cada comunidade foi determinado o número (ai) de famílias que traba-lham na coleta. Estimar a proporção e o número médio de famílias por comunidade envolvidas nessa atividade. O número total de fa-mílias na população é 4.200. Considerar cada comunidade como um conglomerado. Os dados estão apresentados na Tabela 9.6. Neste exercício, é importante observar que há variação no tamanho do conglomerado, então será uma estimativa por razão para p.
tabela 9.6 - Número de famílias, por comunidade, envolvidas na coleta )( ia .
CO Mi
ai pi CO Mi ai pi CO Mi ai pi
1 24 11 0,474190 11 20 11 0,526656 21 18 9 0,5029412 20 9 0,438285 12 30 15 0,498580 22 20 11 0,5287463 18 9 0,482603 13 22 10 0,468295 23 22 10 0,4493584 21 10 0,458886 14 20 10 0,520994 24 21 11 0,5077735 20 10 0,494757 15 21 11 0,509420 25 22 10 0,4431846 16 8 0,509868 16 23 12 0,500911 26 22 10 0,4832887 21 10 0,465188 17 29 16 0,538024 27 17 9 0,5191648 26 13 0,513292 18 14 7 0,486561 28 17 8 0,4831699 15 6 0,392642 19 18 8 0,440110 29 24 12 0,486588
10 19 10 0,508764 20 25 13 0,512418 30 15 7 0,500293
Tem-se que:Número total de famílias entrevistadas �
�
30
1i
iM = 620
260
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Número total de famílias que fazem coleta
a) proporção estimada
b) variância da proporção estimada
Dado que ;3262
30
1
2��
�i
ia ;13236
30
1
2
��
�i
iM ��
�30
1
6555i
iiMa , tem-se:
c) intervalo de confiança para a proporção
Pode-se afirmar, com uma probabilidade de acerto de 95%, que a porcentagem populacional de famílias envolvidas na cole-ta de castanha está no intervalo de 48,15% a 50,56%.
��
30
1i
ia = 306
493548,0620
30630
1
30
1���
�
�
�
�
i
i
i
i
M
a
p
1
21
)(ˆ 1 1 1
222
�
���
�
� � �� � �
n
MpMapa
nN
nN
MpV
n
i
n
i
n
i
iiii
N
29
13236493548,06555493548,023262
20030
30200
21
1)(ˆ
2
2
������
�
���pV
0,21200
4200
3 0
1 ����
�
N
M
M i
i
N
71430000348667,0)(ˆ �pV
780059048091,0)( �ps
780059048091,00452,2493548,0 ���IC
505624515,0481471484,0 �� P
261
Amostragem por conglomerado
d) número médio estimado de famílias por comunidade en-volvidas na coleta de castanha
e) variância estimada do número médio de famílias por co-munidade envolvidas na coleta de castanha
f) intervalo de confiança para o número médio de famílias por comunidade envolvidas na coleta de castanha
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o número médio populacional de famílias por comunidade envolvidas na coleta de castanha está no intervalo de 10,1109 famílias a 10,6181 famílias.
9.4 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ES-TáGIOS
Para o melhor entendimento das fórmulas de variâncias utilizadas na amostragem por conglomerados, é necessário ob-ter os componentes de variância considerando o modelo mate-mático utilizado.
364508,10493548,021 ����� pMyNR
1240,00452,2364508,10 ���IC
6181,101109,10 �� Y
015376246,071430000348667,021)(ˆ)(ˆ 22���� pVMyV
NR
1240,0)( �Rys
262
Amostragem em inventário florestal Waldenei Travassos de Queiroz
9.4.1 componentes de variâncias no modelo inteiramente ao acaso
Existem vários métodos para obter estimativas de compo-nentes de variâncias, sendo o mais usado é o método dos mo-mentos ou da análise de variância. Barbin (1993) cita a existên-cia dos seguintes métodos:
a) métodos da Máxima Verossimilhança, onde os métodos de Herderson I, II e III são de análise de variância para dados não balanceados;
b) método da Máxima Verossimilhança Restrita;
c) método de RAO denominado de MINQUE (Minimum Norm Quadratic Unbiased Estimative);
d) método de RAO denominado de MIVQUE (Minimum Va-
riance Quadratic Unbiased Estimative);
e) os métodos de Bayes.
Considerando a disposição dos dados conforme a Tabela 9.7 e a análise de variância para a população com base nas subparcelas de acordo com a Tabela 9.8, para obter os com-ponentes de variâncias para a amostragem por conglomerados em dois estágios, modelo inteiramente ao acaso, usar-se-á o método dos momentos ou da análise de variância para calcular os componentes de variâncias que consiste em obter a espe-rança matemática dos quadrados médios (QM) da análise de variância, onde as estimativas dos QM são igualadas às suas respectivas esperanças matemáticas.
263
Amostragem por conglomerado
tabela 9.7 - Dados populacionais.
Subparcelas Conglomerados1 2 .... N
1
2...
M
y11 y21 ••• yN1
y12 y22 ••• yN2 ••• ••• ••• •••
y1M y2M ••• yNM
Totais y1 • y2• ••• yN•
tabela 9.8 - Análise de variância para população com base nas subparcelas.
Causas de variação G.L. SQ QM
Conglomerados
Resíduo
N-1
N(M-1)
)1/( �NSQCong
)]1(/[ �MNSQDentro
)1/( �NSQCong
)]1(/[ �MNSQDentro
Total NM-1 )1/( �NMSQTotal
)1/( �NMSQTotal
Considerando os conglomerados aleatórios, então os com-ponentes de variância são obtidos segundo o modelo matemáti-co do delineamento inteiramente ao acaso, portanto:
Y = média geral, sendo E(Y ) =Y e E( 2Y ) = 2Y
ci = efeito de conglomerados ( Ni ,,1 L= ) considerado alea-tório, normal e independentemente distribuído com média zero e variância Ve(y), ou seja, ci~N [0,Ve(y)], para E(ci ) = 0 e E( 2
ic ) = Ve(y). =)(yVe componente de variância entre os conglomerados.
ije = erro suposto aleatório com Mj ,,1 L= , normal e inde-
ijiij ecYy ���
264
Amostragem em inventário florestal Waldenei Travassos de Queiroz
pendentemente distribuído com média zero e variância Vd (y), ou seja, eij ~ N[(0 , )(yVd ], dado que E( ije )= 0 e E( 2
ije ) = Vd (y).
)(yVd é definido como o componente de variância entre as subparcelas dentro dos conglomerados.
Supondo que os efeitos aleatórios do modelo são não cor-relacionados, logo:
0),( �iji
ecCov , � i,j
0),( ' �ii ccCov para 'ii �
0),( '' �jiij eeCov para 'ii � e 'jj �
Sejam as expressões das Somas de Quadrados (SQ) do modelo para obter as esperanças matemáticas dos quadrados médios.
��� �
��N
i
M
j
ijT otal CySQ1 1
2, onde
NM
y
C
N
i
M
j
ij��� �
�1
2
1
)(
��
��
N
iiCong Cy
MSQ
1
2.
1
� ��� ��
����N
i
N
i
i
M
j
ijCongTotals yM
ySQSQSQ1 1
2
.
1
2
Re
1
� ���� � ��
���N
i
N
i
M
j
iji
M
j
ij ecYEyE1 1
2
11
2 )()(
� ���� � ��
������N
i
N
i
M
jijiijiiji
M
jij eceYcYecYEyE
1 1 1
222
1
2)222()(
)()(])()([)( 2
1 1 1
2
1
2 yNMVyNMVYNMyVyVYyEde
N
i
N
i
M
j
de
M
j
ij������� ���
� � ��
(9.6)
��
��
� �
� �����
N
i
M
j
iji
N
i
M
j
ij
ecYENMNM
y
ECE1 1
21
2
1)]([
1)
)(
()(
])()([1
)(1 1
2
1
22222 dpecMYMNENM
CEN
i
M
j
ij
N
i
i ���� ���� ��
265
Amostragem por conglomerado
dp = duplos produtos
(9.7)
Dado que:
Das Expressões 9.6 e 9.7, têm-se:
Então:
��� �
��N
i
M
j
ijT otal CySQ1 1
2, onde
NM
y
C
N
i
M
j
ij��� �
�1
2
1
)(
��
��
N
iiCong Cy
MSQ
1
2.
1
� ��� ��
����N
i
N
i
i
M
j
ijCongTotals yM
ySQSQSQ1 1
2
.
1
2
Re
1
� ���� � ��
���N
i
N
i
M
j
iji
M
j
ij ecYEyE1 1
2
11
2 )()(
� ���� � ��
������N
i
N
i
M
jijiijiiji
M
jij eceYcYecYEyE
1 1 1
222
1
2)222()(
)()(])()([)( 2
1 1 1
2
1
2 yNMVyNMVYNMyVyVYyEde
N
i
N
i
M
j
de
M
j
ij������� ���
� � ��
(9.6)
��
��
� �
� �����
N
i
M
j
iji
N
i
M
j
ij
ecYENMNM
y
ECE1 1
21
2
1)]([
1)
)(
()(
])()([1
)(1 1
2
1
22222 dpecMYMNENM
CEN
i
M
j
ij
N
i
i ���� ���� ��
)()()]()([1
)( 22222 yVyMVYNMyNMVyVNMYMNNM
CEdede
������
)()()( 2
21
1
2 yNVcccEcE eN
N
i
i �������
�
)()()( 2
1211
1 1
2 yNMVeeeEeE dNM
N
i
M
j
ij �������� �
�
)]()([)()()(22 yVyMVYNMyNMVyNMVYNMSQE dedeTotal ������
)1)(())(()( ���� NMyVMNMyVSQE deTotal
1
)1)(())(()(
�
����
NM
NMyVMNMyVQME de
Total
� �
� �
� �
� ���
N
i
N
i
ii
N
i
M
j
ij
yEM
yEMM
y
E1 1
2
.
2
.
2
1 1)(
1)(
1]
)(
[
.
1
i
M
j
ij yy ���
� ��� ��
���
N
i
M
j
iji
N
i
i eMcYMEM
yEM 1 1
2
1
2
. )(1
)(1
� ��� ��
����N
i
M
j
iji
N
i
i dpecMYMEM
yEM 1 1
22222
1
2
. ])([(1
)(1
����
����N
i
de
N
i
iyMVyVMYM
MyE
M 1
222
1
2
.]0)()([
1)(
1
)()()(1 2
1
2
.yNVyNMVNMyE
Mde
N
i
i����
�
� (9.8)
266
Amostragem em inventário florestal Waldenei Travassos de Queiroz
(9.8)
Das Expressões 9.8 e 9.7, têm-se:
Sendo:
Na Tabela 9.9, considerando o delineamento inteiramen-te ao acaso, é apresentado o esquema de análise de variância com os componentes de variância.
1
)1)(())(()(
�
����
NM
NMyVMNMyVQME de
Total
� �
� �
� �
� ���
N
i
N
i
ii
N
i
M
j
ij
yEM
yEMM
y
E1 1
2
.
2
.
2
1 1)(
1)(
1]
)(
[
.
1
i
M
j
ij yy ���
� ��� ��
���
N
i
M
j
iji
N
i
i eMcYMEM
yEM 1 1
2
1
2
. )(1
)(1
� ��� ��
����N
i
M
j
iji
N
i
i dpecMYMEM
yEM 1 1
22222
1
2
. ])([(1
)(1
����
����N
i
de
N
i
iyMVyVMYM
MyE
M 1
222
1
2
.]0)()([
1)(
1
)()()(1 2
1
2
.yNVyNMVNMyE
Mde
N
i
i����
�
� (9.8)
)]()([)()()(22 yVyMVYNMyNVyNMVYNMSQE dedeCong ������
)()1()()1()()()()()( yVNyVNMyVyMVyNVyNMVSQEdededeCong
��������
)]()1()()1([1
1)
1()( yVNyVNM
NN
SQEQME de
Cong
Cong ���
�
�
�
�
)()()( yVyMVQME deCong ��
)()()()( CongTotalCongT otalD entro SQESQESQSQESQE ����
)]()1()()1([)]()1()()1([)( yVNyVNMyVNMyVNMSQEdedeDentro
��������
)()1()]()1()]()1()( yVMNyVNyVNMSQE dddDen tro ������
)()]()1([)1(
1]
)1([)( yVyVMN
MNMN
SQEQME
dd
Dentro
Dentro��
�
�
�
�
267
Amostragem por conglomerado
tabela 9.9 - Modelo inteiramente ao acaso com os componentes de vari-ância.
Causas de Variação G.L. SQ QM E(QM)
Entre cong.
Dentro cong.
N-1
N(M-1)
Total NM-1
Pode-se, então, obter os seguintes estimadores:
9.4.2 parâmetros populacionais e estimadores
Neste processo, em cada unidade primária (conglomera-do) selecionada é medida uma subamostra de unidades secun-dárias ou subparcelas.
Será considerado, para formulação dos parâmetros popu-lacionais e seus estimadores, que os n conglomerados selecio-nados contêm o mesmo número m de subparcelas.
Seja a seguinte notação:ijy = valor da variável resposta da j-ésima subparcela cor-
respondente ao i-ésimo conglomerado;.iy = valor total das subparcelas do i-ésimo conglomerado;
Y = valor médio populacional dos conglomerados;Y = valor médio populacional das subparcelas;y = valor médio estimado dos conglomerados;y = valor médio estimado das subparcelas;Y = valor total populacional; Y = valor total estimado.
)1/( �NSQCong
)]1(/[ �MNSQDentro
)1/( �NMSQTotal
)1/( �NSQCong
)]1(/[ �MNSQDentro
)()( yMVyV ed �
)(yVd
1
)1)(())((
�
���
NM
NMyVMNMyV de
Dentrod MQyV ˆ)(ˆ� e
m
MQMQyV
DentroCon g
e
ˆˆ)(ˆ
�
�
268
Amostragem em inventário florestal Waldenei Travassos de Queiroz
a) valor médio por conglomerado e por subparcela
b) valor total Y e seu estimador Y
c) variâncias populacionais e seus estimadores
Dado que:)(1 yV = variância populacional entre os valores médios dos
conglomerados;)(2 yV = média das variâncias populacionais das subparce-
las dentro dos conglomerados;)(1 yV = variância estimada entre os valores médios dos
conglomerados;)(ˆ
2 yV = média das variâncias estimadas das subparcelas dentro dos conglomerados;
)(yV = variância populacional da média dos conglomerados;)(yV = variância populacional da média das subparcelas;)(ˆ yV = variância estimada da média dos conglomerados;)(ˆ yV = variância estimada da média das subparcelas.
Então:
1
)(
1
)(
)(
2
1
11
2
1�
�
��
�
�
���
�
��
N
N
Y
Y
N
YY
yV
N
i
iN
i
i
N
i
i
��
�N
i
iyV
NyV
1
22 )(1
)( , sendo:
1
)(
1
)(
)(
2
1
1
2
1
2
2�
�
��
�
�
���
�
��
M
M
y
y
M
Yy
yV
M
j
ijM
j
ij
M
j
iij
i
;1
.
N
y
Y
N
i
i��� ;
1
.
M
Y
NM
y
Y
N
i
i
��
�� ;1
.
n
y
y
n
i
i���
m
y
nm
y
y
n
i
i
��
��1
.
;YNMYNY �� yNMyNY ��ˆ
269
Amostragem por conglomerado
Resultando os estimadores:
Se os n conglomerados e as m subparcelas forem sele-cionados por amostragem simples ao acaso, conclui-se, como demonstrado em Vries (1986), que y é uma estimativa sem ten-dência de Y e sua variância é:
Sendo as frações amostrais do primeiro e do segundo es-tágios:
N
nf �1
eM
mf �2
, pode-se usar a Fórmula 9.9.
mn
yVf
n
yVfyV
)()1(
)()1()( 2
21
1 ����
, pode-se usar a Fórmula 9.9.
N
nf �1
eM
mf �2
, pode-se usar a Fórmula 9.9.
mn
yVf
n
yVfyV
)()1(
)()1()( 2
21
1 ���� (9.9)
1
)(
1
)(
)(
2
1
11
2
1�
�
��
�
�
���
�
��
N
N
Y
Y
N
YY
yV
N
i
iN
i
i
N
i
i
��
�N
i
iyV
NyV
1
22 )(1
)( , sendo:
1
)(
1
)(
)(
2
1
1
2
1
2
2�
�
��
�
�
���
�
��
M
M
y
y
M
Yy
yV
M
j
ijM
j
ij
M
j
iij
i
1
)(
)(ˆ
2
1
1
2
1�
�
�
��
�
�
n
n
y
y
yV
n
i
in
i
i
��
�n
i
i yVn
yV1
22 )(ˆ1)(ˆ , tal que:
1
)(
1
)(
)(ˆ
2
1
1
2
1
2
2�
�
��
�
�
���
�
��
m
m
y
y
m
y
yV
m
j
ijm
j
ij
m
j
ij
i
yi
mn
yV
M
mM
n
yV
N
nNyV
)()(
)()()(
21 �
�
�
�
270
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Sendo sua estimativa sem tendência dada pela Fórmula 9.10.
(9.10)
Sendo:
1
)()(ˆ 1
2
1 −
−=∑
=
n
yyyV
n
ii
; )1(
)(
)(ˆ 1
2
12 −
−=∑∑
= =
mn
yy
yV
n
ii
m
jij
A Fórmula 9.10 pode ser escrita na forma 9.11 em função dos componentes de variância.
(9.11)
Verificação:Seja:
Então:
Logo:
Dado que:
mn
yVff
n
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
21
1
1����
NM
yV
N
yV
nm
yV
n
yVyV dede
)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ
����
mn
yVff
n
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
21
1
1����
mn
yV
M
m
N
n
n
yV
N
nyV
)(ˆ)1(
)(ˆ)1()(ˆ 21
����
NM
yV
Nm
yV
N
yV
n
yVyV
)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ 2211
����
m
yVyV
m
yVmyV
m
MQ
n
yy
yV d
e
edEntre
n
i
i)(ˆ
)(ˆ)(ˆ)(ˆˆ
1
)(
)(ˆ 1
1��
���
�
�
�
��
)(ˆ)(ˆ2
yVyV d�
2
271
Amostragem por conglomerado
Portanto:
Resultando:
Expandindo-se para o total da população, tem-se:
d) intensidade de amostragem para população finita
e) intensidade de amostragem para população finita em função dos componentes de variância
NM
yV
Nm
yV
N
m
yVyV
n
m
yVyV
yV dd
d
e
d
e )(ˆ)(ˆ)(ˆ
)(ˆ)(ˆ)(ˆ
)(ˆ ��
�
�
�
�
NM
yV
Nm
yV
Nm
yV
N
yV
nm
yV
n
yVyV dddede
)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ ������
NM
yV
N
yV
nm
yV
n
yVyV dede )(ˆ)(ˆ)(ˆ)(ˆ
)(ˆ����
)(ˆ)(ˆ)ˆ(ˆ 22yVMNyNMVYV ��
])(ˆ)(ˆ)(ˆ)(ˆ
[)(ˆ 2211222
NM
yV
Nm
yV
N
yV
n
yVtyVtE �����
])(ˆ)(ˆ)(ˆ
[)(ˆ
2212122
NM
yV
Nm
yV
N
yVt
n
yVtE ����
])(ˆ)(ˆ
)(ˆ[
)(ˆ
22
1
2
2
1
2
M
yV
m
yVyV
N
tE
yVtn
���
�
])(ˆ)(ˆ)(ˆ)(ˆ
[)(ˆ 222
NM
yV
N
yV
nm
yV
n
yVtyVtE dede
�����
])(ˆ
)(ˆ[])(ˆ
)(ˆ[22
2
M
yVyV
N
t
m
yVyV
n
tE d
e
d
e ����
])(ˆ
)(ˆ[
])(ˆ
)(ˆ[
22
2
M
yVyV
N
tE
m
yVyVt
nd
e
d
e
��
�
�
272
Amostragem em inventário florestal Waldenei Travassos de Queiroz
f) número ótimo de subparcelas para população finita A fórmula para obter o número ideal de subparcelas é obti-
da minimizando a função custo dada pela expressão C = nc1 + nmc2 que é muito usada em inventários florestais.
C = c1n + c2nm
C = custo total de medição de campo;c1 = custo médio de deslocamento entre conglomerados;c2 = custo médio de medição das subparcelas.
Então:
)( 2121 mccnnmcncC ����
Para:
]
)(ˆ)(ˆ[
])(ˆ
)(ˆ[
22
2
M
yVyV
N
tE
m
yVyVt
nd
e
de
++
+=
Por conseguinte:
])(ˆ
)(ˆ[
)]()(ˆ
)(ˆ[
2
2
21
2
M
yVyV
N
tE
mccm
yVyVt
Cd
e
d
e
��
��
�
)](ˆ)(ˆ)(ˆ)(ˆ[
])(ˆ
)(ˆ[
22
1
12
2
2
yVcyVmcm
yVccyV
M
yVyV
N
tE
tC
de
d
e
d
e
���
��
�
])(ˆ)(ˆ)(ˆ)(ˆ
[)(ˆ 222
NM
yV
N
yV
nm
yV
n
yVtyVtE dede
�����
])(ˆ
)(ˆ[])(ˆ
)(ˆ[22
2
M
yVyV
N
t
m
yVyV
n
tE d
e
d
e ����
])(ˆ
)(ˆ[
])(ˆ
)(ˆ[
22
2
M
yVyV
N
tE
m
yVyVt
nd
e
d
e
��
�
�
273
Amostragem por conglomerado
Tomando-se a primeira derivada em relação a m e anulan-do, tem-se:
Logo:
)(ˆ)(ˆ
2
1
yVc
yVcm
e
dOti =
De acordo com Péllico Netto e Brena (1997), os estima-dores das variâncias podem ser obtidos segundo o critério da análise de variância para o modelo aleatório. Não obstante, considerando 1)1( ��� nmnm e atendendo à condição de que a amostra por conglomerados, geralmente, é aplicada às popu-lações extensas, o estimador da variância entre as subunidades considerando todos os conglomerados é: )(ˆ)(ˆ)(ˆ yVyVyV de += , onde: )(ˆ yVe
é o componente de variância entre conglomerados e )(ˆ yVd é o componente de variância entre subparcelas dentro dos conglomerados.
Cochran (1977), Vries (1986) e Sanquetta et al. (2009) expõem teoricamente os estimadores da amostragem em con-glomerados como sendo uma estrutura monolítica, ou seja, os
)](ˆ)(ˆ[
])(ˆ
)(ˆ[
22
1
2
2
2
yVcm
yVc
M
yVyV
N
tE
t
dm
Ce
d
d
e
��
��
�
0�
dm
C
0)](ˆ)(ˆ[ 22
1��� yVc
m
yVce
Oti
d
)(ˆ
)(ˆ
2
12
yVc
yVcm
e
d
Oti �
274
Amostragem em inventário florestal Waldenei Travassos de Queiroz
conglomerados são previamente definidos e os parâmetros são conceitualmente apresentados para a modelagem matemática usando a análise de variância, daí ter-se a fórmula para o coefi-ciente de correlação intraconglomerados (d ), a partir dos com-ponentes de variância entre e dentro dos conglomerados.
Considerando os fatores de correção para o primeiro e se-gundo estágios desprezíveis, a expressão para o estimador da variância da média por subparcela, em função do coeficiente de correlação intraconglomerado, é:
O estimador d é definido como o coeficiente de correlação intraconglomerado, o qual explica o grau de dependência entre as subparcelas dentro dos conglomerados. Este coeficiente é importante para delinear a estrutura amostral do conglomerado. O valor )1(ˆ −md mede a eficiência da amostragem por conglome-rados em relação à amostra simples ao acaso.
Dado que:
)(ˆ)1)(1(
)(ˆ)1()ˆ()1(ˆ
yVmnm
yVnmMQmnEn tre
��
�����
Sob a condição )1()1( ��� nmmn , resulta:
)(ˆ)(ˆ)(ˆ
)(ˆ)(ˆ
ˆyVyV
yV
yV
yV
de
ee
+==d
Para obtenção da expressão:
)]1(ˆ1[)(ˆ
)(ˆ ��� mnm
yVyV �
Pode-se adotar o seguinte procedimento:
)]1(ˆ1[)(ˆ
)(ˆ ��� mnm
yVyV �
275
Amostragem por conglomerado
Seja a equação:
Esta fórmula pode ser escrita da seguinte forma:
Destarte:
O valor ])()([ 21 MyVyV − é o componente de variância entre
os valores médios dos conglomerados Ve(y), assim como )(2 yV é o componente de variância entre os valores médios das subpar-celas dentro dos conglomerados Vd(y). Considerando que o valor N seja grande, tal que NyV )(1 seja desprezível, tem-se:
Consequentemente:
Dado que )()( yVyVe d= e )()()( yVyVyV de += , então:
)]()([(1
)(1
)( yVyVnm
yVn
yV �� ���
)]1(1
[)(
)( dd −+=mn
yVyV
)1
()(
)(m
m
n
yVyV
dd −+=
mn
yV
M
mM
n
yV
N
nNyV
)()(
)()()( 21
�
�
�
�
Mn
yV
mn
yV
N
yV
n
yVyV
)()()()()( 2211
����
)(1
)(1
])(
)([1
)( 12
2
1 yVN
yVnmM
yVyV
nyV ����
)(1
])(
)([1
)( 2
2
1 yVnmM
yVyV
nyV ���
)(1
)(1
)( yVnm
yVn
yVde
��
276
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Finalmente:
Destarte:
É importante verificar que:
Se 1f é desprezível, a fórmula mn
yVff
n
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
21
1
1����
será simplificada para:
n
yVyV
)(ˆ)(ˆ 1=
Como m
yVyVyV d
e
)(ˆ)(ˆ)(1 += , então:
Dado que:
)(ˆ)(ˆ
)(ˆ)(ˆ)(ˆ
ˆyV
yV
yVyV
yV e
de
e =+
=d , pois )(ˆ)(ˆ)(ˆ yVyVyV de +=
Então:
)]1(1[)(
)( ��� mnm
yVyV �
)]1(ˆ1[)(ˆ
)(ˆ ��� mnm
yVyV �
n
yV
nm
yV
n
yVyV de )()()()( 1
���
nm
yV
n
yV
m
yVyV
nyV ded
e
)(ˆ)(ˆ)
)(ˆ)(ˆ(
1)(ˆ ����
nm
yVyV
n
yVyV
)(ˆˆ)(ˆ)(ˆˆ)(ˆ �� �
��
nm
yVyVyVmyV
)(ˆˆ)(ˆ)(ˆˆ)(ˆ �� ��
�
277
Amostragem por conglomerado
Logo:
Finalmente:
Para efeitos práticos em inventários florestais, Péllico Netto e Brena (1997) recomendam que o limite aceitável do valor do coefi-ciente de correlação intraconglomerado seja de 4,0≤d , pois, para
4,0>d a população estará mais apropriada para estratificação. g) intensidade de amostragem para populações infinitas A fórmula para obter o número de conglomerado (n) é ob-
tida fixando-se a semiamplitude do intervalo de confiança (E). O valor E é definido como uma porcentagem da média. A por-centagem estabelecida é denominada de Limite de Erro (LE) ou margem de erro, originando a expressão E = LE yLEE ×= .
Dado que E = LE yLEE ×= , então E = LE )(ystyLEE ×=×= e )(ˆ22 yVtE = , logo:
Resultando:
)]1(ˆ1[)(ˆ
2
2
−+= mmE
yVtn d
h) número ótimo de subparcelas para populações infinitas
)ˆ1ˆ()(ˆ)(ˆˆ)(ˆ)(ˆˆ
)(ˆ ����
�����
� mnm
yV
nm
yVyVyVmyV
)]1(ˆ1[()(ˆ
)(ˆ ��� mmnm
yVyV �
)]1(ˆ1[)(ˆ
)(ˆ2
22���� m
nm
yVtyVtE �
)]1(ˆ1[)(ˆ
)(ˆ2
22���� m
nm
yVtyVtE �
278
Amostragem em inventário florestal Waldenei Travassos de Queiroz
A fórmula para obter o número ideal de subparcelas é obtida minimizando a função custo dada pela expressão C = nc1 + nmc2
C = custo total de medição no campo;c1 = custo médio de deslocamento entre conglomerados;c2 = custo médio de medição das subparcelas.
Como C = nc1 + nmc2 e )]1(ˆ1[)(ˆ
2
2
−+= mmE
yVtn d , então:
Tomando-se a primeira derivada, tem-se:
Dada a condição 0�dm
dC , então:
0)ˆ1ˆ1(
)(ˆ122122
2
=++− cm
ccmE
yVt
OtiOti
dd , logo:
0)ˆ1ˆ1( 12212
=++− cm
ccm OtiOti
dd
⇒=++− 0ˆ)ˆ1( 221 c
m
c
Oti
dd 0ˆ)ˆ1( 22
1 =++− cmc Otidd
Então:)ˆ1(ˆ
122 dd −= ccmOti
22
2
12
2
)]1(ˆ1[)(ˆ
)]1(ˆ1[)(ˆ
mcmmE
yVtcm
mE
yVtC ������ ��
))](1(ˆ1[)(ˆ
212
2
mccmmE
yVtC ���� �
22
2
12
2
22
2
12
2
22
2
12
2 ˆ)(ˆˆ)(ˆˆ)(ˆˆ)(ˆ)(ˆ)(ˆc
E
yVtc
mE
yVtmc
E
yVtc
E
yVtc
E
yVtc
mE
yVtC
����������
)ˆˆ
ˆˆ1(
)(ˆ
2121212
2
ccm
mccccmE
yVtC �
��� ������
)ˆ1ˆ1(
)(ˆ122122
2
cm
ccmE
yVt
dm
dC�� ����
279
Amostragem por conglomerado
Finalmente:
)ˆ
ˆ1(
2
1
dd−
=c
cmOti
Esta fórmula também pode ser escrita da seguinte forma:
)(ˆ)(ˆ
2
1
yV
yV
c
cm
e
dOti =
Verificação:Dado que:
)(ˆ)(ˆ
)(ˆ)(ˆ)(ˆ
ˆyV
yV
yVyV
yV e
de
e =+
=d
Então:
]
)(ˆ)(ˆ)(ˆ
)(ˆ)(ˆ
[]
)(ˆ)(ˆ
)(ˆ)(ˆ
1
[2
1
2
1
yV
yV
yV
yVyV
c
c
yV
yV
yV
yV
c
cm
e
e
e
e
Oti
−
=
−
=
)(ˆ)(ˆ
2
1
yV
yV
c
cm
e
dOti = (9.12)
Tomando-se a segunda derivada para verificar a natureza do ponto crítico, tem-se:
)ˆ1()(ˆ2
)ˆ22(
)(ˆ
32
21
13132
2
2�� ����
mE
yVtcc
mc
mE
yVt
dm
dC
Dado que )()](ˆ2[ 3221 mEyVtc )] / (E2m2) é um termo sempre positivo,
280
Amostragem em inventário florestal Waldenei Travassos de Queiroz
logo Otim obtido pela Fórmula 9.12 torna mínimo o custo do in-ventário quando 1ˆ ≠d , pois dC / dm2 > 0.
É importante sublinhar que a expressão para obter o nú-mero ótimo de subparcelas do conglomerado é a mesma tanto para população finita como para infinita.
9.4.3 ocorrência de estimativa negativa do componente de variância entre conglomerados )(ˆ yVe
O valor )1(ˆ −md mede a eficiência da amostragem por con-glomerados em relação à amostra simples ao acaso. Quando
0ˆ >d a amostra simples ao acaso (ASA) é mais precisa que a amostra por conglomerados. Se 0ˆ <d a ASA é menos precisa que a amostra por conglomerados. Quando 0ˆ =d a precisão é a mesma entre a ASA e a amostra por conglomerados.
A fórmula do coeficiente de correlação intraconglomerado dada por )](ˆ)(ˆ[)(ˆˆ yVyVyV dee +=d )], sendo mMQMQyV DentroEntree )ˆˆ()(ˆ −= e
Dentrod MQyV ˆ)(ˆ = , denota que se 0ˆ <d implica que 0)(ˆ <yVe , ou seja, o componente de variância estimado entre os conglome-rados é negativo. Neste caso, tem-se que: DentroEntre MQMQ ˆˆ < e, consequentemente, .1ˆˆ <= DentroEntre MQMQF
Searle (1971) recomenda considerar os seguintes procedi-mentos quando 0)(ˆ <yVe
:
a) considerar a estimativa como negativa admitindo que o parâmetro )(yVe seja nulo. Este procedimento pode trazer pro-blema na aplicação de determinadas fórmulas.
No caso da expressão:
)]1(ˆ1[)(ˆ
2
2
−+= mmE
yVtn d )]
281
Amostragem por conglomerado
Não haverá dificuldade de operar matematicamente.
Por outro lado, para obter )ˆ
ˆ1(
2
1
dd−
=c
cm , deverá ocorrer
.0ˆ >d
b) admitir o valor do parâmetro 0)( =yVe e considerar a es-timativa negativa como nula. Neste caso é recomendável testar a hipótese 0)(:0 =yVH e , aplicando o teste F bilateral;
c) considerar o valor do parâmetro como zero e retirá-lo do modelo de análise de variância;
d) o uso de modelo matemático inadequado pode resultar na presença de estimativas de componentes de variância negativas;
e) o método utilizado para obter as estimativas de compo-nentes de variância pode não ser adequado. Neste caso usar outros procedimentos;
f) a presença de estimativas de componentes de variância negativas pode estar relacionada ao problema do tamanho da amostra. Neste caso é importante medir mais conglomerados.
exercício 9.5
Seja o exemplo, apresentado em Queiroz (1998), de um inventário florestal com amostragem em dois estágios de uma área com 49.000 ha, onde foram mensurados 20 conglomera-dos. A estrutura espacial do conglomerado apresentou a forma cruz de malta, composta por quatro subparcelas retangulares de 10 m de largura por 250 m de comprimento. A distância de cada subunidade ao ponto central foi de 100 m. Os dados da variável
282
Amostragem em inventário florestal Waldenei Travassos de Queiroz
resposta volume total de madeira considerando todas as espé-cies com DAP 45 cm estão apresentados na Tabela 9.10. A resolução deste exemplo será realizada de três formas:
1) Analisar a partir das subparcelas considerando a popu-lação infinita.
2) Analisar por meio das subparcelas considerando a po-pulação finita.
3) Análise considerando o conglomerado como unidade amostral, usando a metodologia da amostra simples ao acaso.
4) Comparar os resultados dos referidos procedimentos de análise.
tabela 9.10 - Conglomerado (C) em dois estágios (m3/ 0,25 ha).
C S1 S2 S3 S4 Total Média Variância1 43,75 42,50 32,75 57,10 176,10 44,0250 100,16082 62,75 47,25 34,50 66,01 210,51 52,6275 213,02673 77,65 73,50 69,25 39,50 259,90 64,9750 300,19424 57,20 67,50 37,50 38,02 200,22 50,0550 219,28285 51,10 43,50 58,25 58,25 211,10 52,7750 49,59426 68,00 75,50 37,28 64,33 245,11 61,2775 277,55647 45,76 34,80 57,30 63,17 201,03 50,2575 158,49718 60,10 78,70 58,33 37,27 234,40 58,6000 287,10069 63,75 79,90 75,13 42,23 261,01 65,2525 281,469110 49,88 55,17 35,37 44,24 184,66 46,1650 71,709611 88,17 67,30 65,28 37,13 257,88 64,4700 439,276912 27,18 34,89 64,30 58,17 184,54 46,1350 320,183513 37,80 48,24 49,15 58,89 194,08 48,5200 74,310214 55,71 58,29 43,16 37,12 194,28 48,5700 101,942915 45,11 43,12 55,83 54,17 198,23 49,5575 40,613716 35,35 63,23 70,90 85,14 254,62 63,6550 438,483017 48,15 38,90 61,37 55,33 203,75 50,9375 93,600918 38,75 45,17 40,44 39,89 164,25 41,0625 7,993819 49,10 55,13 63,17 37,14 204,54 51,1350 120,267520 50,10 52,70 37,37 57,13 197,30 49,3250 71,9438
Total 1055,36 1105,29 1046,63 1030,23 4237,51 3667,2077
283
Amostragem por conglomerado
1) Analisar a partir das subparcelas considerando a po-pulação infinita
a) valor médio estimado por conglomerado
b) valor médio estimado por subparcela
c) análise de variância e obtenção dos componentes de variância
tabela 9.11- Conglomerado em dois estágios: análise de variância.
CAUSAS DE VARIAÇÃO GL SQ QM
Entre conglomeradosDentro dos conglomerados
1960
4.178,157511.001,6220
219,9030183,3604
TOTAL 79 15.179,7790 192,1491
d) coeficiente de correlação intraconglomerado estimado
hamn
y
y
n
i
i
/8755,21120
51,4237 31
.
���
��
ha ;mm
y
nm
y
y
n
i
i
25,0/9689,524
8755,211 31
.
�����
� y ���������� m / ha3
23)25,0/(1357,9
4
3604,1839030,219ˆˆ)(ˆ ham
m
MQMQyV DentroEntre
e ��
��
�
23)25,0/(3604,183ˆ)(ˆ hamMQyV Dentrod ��
23)25,0/(4961,192)(ˆ)(ˆ)(ˆ hamyVyVyV de ���
047459143,03604,1831357,9
1357,9
)(ˆ)(ˆ
)(ˆˆ �
��
��
yVyV
yV
de
e�
284
Amostragem em inventário florestal Waldenei Travassos de Queiroz
e) variância da média população infinita
Usando a fórmula:
Verifica-se que este resultado é o mesmo obtido pela fórmula:
O resultado idêntico confirma tratar-se de fórmulas seme-lhantes.
f) intervalo de confiança para o valor médio
A metodologia para a obtenção do intervalo de confiança é a mesma para os procedimentos expostos, com exceção para o número de graus de liberdade da estatística “t” de Student que no caso da aplicação da amostragem simples ao acaso será n -1. O número de graus de liberdade na amostra por conglomerados, quando analisada por meio das subparcelas, é n(m – 1).
Limite inferior para o valor médio
)]14(047459143,01[420
4961,192)]1(1[
)(ˆ)(ˆ ��
����� m
nm
yVyV �
23)25,0/(74878,2)]1(1[
)(ˆ)(ˆ hamm
nm
yVyV ���� �
232 )/(98048,4374878,24)(ˆ hamyV ���
)/(631778,6)( 3 hamys �
)25,0/(748788,220
975763,54)(ˆ)(ˆ 31 ham
n
yVyV ���
)]1(1[)(ˆ
)(ˆ ��� mnm
yVyV �
)(025.0;60 ysty �� = 211,8755 - 2,0003 � 6,631778 = 198,61 m3/ ha
631778,698048,43)(ˆ)( ��� yVys
285
Amostragem por conglomerado
Limite superior para o valor médio )(025.0;60 ysty �� = 211,8755 + 2,0003 � 6,631778 = 225,14 m3/ ha
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 198,61 m3/ ha a 225,14 m3/ ha.
g) intervalo de confiança para o valor total
Limite inferior para o valor total Área[ )(025,0;60 ysty �� ] = 49.000 � 198,60922 = 9.731.887,77 m3
Limite superior para o valor totalÁrea )]([ 025,0;6 0 ysty �� = 49.000 � 225,141046 = 11.031.911,23 m3
Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 9.731.887,77 m3 a 11.031.911,23 m3.
h) limite de erro ou margem de erro (LE) do inventário flo-
restal Seja E a semiamplitude de intervalo de confiança e LE o
limite de erro:
)(ystE ×= E = 2,0003 )(ystE ×= 6,631778 = 13,265546 m3/ ha
%26,61008755,211
265546,13100% �����
y
ELE
286
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Pode-se afirmar que o limite de erro ou margem de erro, com uma probabilidade de acerto de 95%, para os valores da média e total populacional encontrados nos intervalos de con-fiança obtidos é de 6,26%.
i) dimensionamento da amostra por conglomerados
Suponha que o limite de erro estipulado seja de 5% (LE=0,05). O resultado da análise mostrou que para 20 conglo-merados o limite de erro foi de 6,26%. Então, deve-se calcular o número de conglomerados para atender o limite de erro (LE) igual a 0,05 e calcular, posteriormente, o número de conglome-rados faltantes.
Dado que E = LE x y = 0,05 x 211,8755 = 10, 593775, tem-se:
36,31]30475,01[4593775,10
9368,30790003,2)]1(ˆ1[
)(ˆ
2
2
2
2
����
����� m
mE
yVtn �
n = 32 conglomerados
Considerando que são necessários 32 conglomerados para atender ao limite de erro escolhido de 5%, deve-se retornar à floresta e medir mais 12 conglomerados, visto que já foram medidos 20 conglomerados.
j) número de subparcelas ideal )
0475,0
0475,01(3)
ˆ
ˆ1(
2
1 −=
−=
dd
c
cmOti
= 7,76
=Otim 8 subunidades
O resultado demonstra que o ideal seria estruturar um con-glomerado com oito subparcelas, o que diminuiria o número de
287
Amostragem por conglomerado
conglomerados a medir, entretanto, deve-se ressaltar que os da-dos usados no exemplo são simulados. Neste exemplo utilizou-se 3/ 21 =cc , considerando as experiências existentes em inven-tários florestais nos trópicos.
2) Analisar por meio das subparcelas considerando a população finita
a) variância da média de população finita
Dado que:
231
2
1 )25,0/(9758,541
)(
)(ˆ hamn
yy
yV
n
i
i
��
�
�
��
231
2
1
2)25,0/(3604,183
)1(
)(
)(ˆ hammn
yy
yV
n
i
i
m
j
ij
��
�
�
� �� �
Sabe-se que:
;19625,0
49 ��ha
haM ;000.1
49
000.49 ��ha
haN ;02,0
000.1
201
���N
nf
0204,0196
42
���M
mf
Então:
mn
yVff
n
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
21
1
1����
204
3604,183)0204,01(02,0
20
975763,54)02,01()(ˆ
�
����yV
23)25,0/(7387,2)(ˆ hamyV �
)25,0/(6549,17387,2)(ˆ)(3
hamyVys ���
232)/(8195,43738717,24)(ˆ hamyV ���
288
Amostragem em inventário florestal Waldenei Travassos de Queiroz
b) limite de erro considerando a população finita
c) intensidade de amostragem de população finita
Usando a fórmula expressa em função dos componentes de variância:
Os demais cálculos são obtidos como mostrado no item anterior (intervalo de confiança, dimensionamento, etc.)
mn
yVff
n
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
21
1
1����
204
3604,183)0204,01(02,0
20
975763,54)02,01()(ˆ
�
����yV
23)25,0/(7387,2)(ˆ hamyV �
)25,0/(6549,17387,2)(ˆ)(3
hamyVys ���
232)/(8195,43738717,24)(ˆ hamyV ���
%25,610097,52
6549,10003,2100
)(��
�
��
�
�
y
ystLE
])(ˆ)(ˆ
)(ˆ[
)(ˆ
22
1
2
2
1
2
M
yV
m
yVyV
N
tE
yVtn
���
�
)196
3604,183
4
3604,1839758,54(
1000
0003,2)97,5205,0(
9758,540003,22
2
2
����
��n
17985518,31054849185,7
9691759,219��n
])(ˆ
)(ˆ[
])(ˆ
)(ˆ[
22
2
M
yVyV
N
tE
m
yVyVt
n
de
d
e
��
�
�
17985518,31
]196
)3604,1831357,9[
1000
0003,2)97,5205,0(
]4
3604,1831357,9[0003,2
2
2
2
�
���
�
�n
289
Amostragem por conglomerado
3) considerando o conglomerado como unidade de ob-servação. obter a média e a variância da média a partir da aplicação da metodologia da amostra simples ao acaso
a) valor médio estimado por conglomerado
.iy = valor total das subparcelas do i-ésimo conglomerado
b) variância da média por conglomerado
4) comparação dos resultados considerando a variân-cia da média para os três procedimentos de análise:
tabela 9.12 - Variância da média por conglomerados em dois estágios.
Estimadores Variância da média (m3/ ha)2
Vries (1986) e Cochran (1977): População Finita 43,8195Péllico Netto e Brena (1997): População Infinita 43,9805Metodologia: Amostra simples ao acaso 43,1010
Os resultados da Tabela 9.12 mostram que as estimativas
da variância da média foram praticamente idênticas, demons-trando, neste exemplo, que os resultados independem da me-todologia usada. No entanto, ressalta-se que se trata de uma
hamn
y
y
n
i
i
/8755,21120
51,4237 31
.
���
��
23
2
1
.
1
2.
. )/(612205,8791
)(
)(ˆ hamn
n
y
y
yV
n
i
in
i
i
i ��
�
�
�� �
�
23. )/(1010,4320
612205,879)
000.1
20000.1(
)(ˆ)()(ˆ ham
n
yV
N
nNyV i �
��
��
290
Amostragem em inventário florestal Waldenei Travassos de Queiroz
população infinita com um coeficiente de correlação intraconglo-merado (0,047459143) próximo de zero.
exercício 9.6
Este exemplo objetiva mostrar a aplicação das fórmulas para obtenção do coeficiente de correlação intraglomerado, as-sim como algumas maneiras de obter os componentes de vari-ância, visando facilitar a interpretação desses parâmetros. A Ta-bela 9.13 apresenta os dados. Obter o coeficiente de correlação intraconglomerado usando as seguintes expressões:
a)
b)
c)
d)
e)
291
Amostragem por conglomerado
tabela 9.13 - Dados considerando cinco conglomerados (C).
C S1 S2 S3 S4 Total Médias VariânciasC1C2C3C4C5
43,7562,7577,6557,2051,10
42,5047,2573,5067,5043,50
32,7534,5069,2537,5058,25
57,1066,0139,5038,0258,25
176,10210,51259,90200,22211,10
44,02552,627564,97550,05552,775
100,160833213,026692300,194167219,282767 49,594167
tabela 9.14 - Cálculos: coeficiente de correlação intraconglomerado.
NPC yij y yik (yij – y )(yik – y )1 43,75 52,8915 42,50 94,993897252 43,75 52,8915 32,75 184,123522253 43,75 52,8915 57,10 -38,472002754 42,50 52,8915 32,75 209,300397255 42,50 52,8915 57,10 -43,732627756 32,75 52,8915 57,10 -84,765502757 62,75 52,8915 47,25 -55,616727758 62,75 52,8915 34,50 -181,312602759 62,75 52,8915 66,01 129,32873225
10 47,25 52,8915 34,50 103,7556472511 47,25 52,8915 66,01 -74,0080177512 34,50 52,8915 66,01 -241,2688927513 77,65 52,8915 73,50 510,2355472514 77,65 52,8915 69,25 405,0119222515 77,65 52,8915 39,50 -331,5534527516 73,50 52,8915 69,25 337,1241472517 73,50 52,8915 39,50 -275,9787277518 69,25 52,8915 39,50 -219,0648527519 57,20 52,8915 67,50 62,9407222520 57,20 52,8915 37,50 -66,3142777521 57,20 52,8915 38,02 -64,0738577522 67,50 52,8915 37,50 -224,8467277523 67,50 52,8915 38,02 -217,2503077524 37,50 52,8915 38,02 228,8946922525 51,10 52,8915 43,50 16,8248722526 51,10 52,8915 58,25 -9,5997527527 51,10 52,8915 58,25 -9,5997527528 43,50 52,8915 58,25 -50,3243527529 43,50 52,8915 58,25 -50,3243527530 58,250 52,8915 58,25 28,71352225
Total 73,14083250
292
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Da Tabela 9.14, tem-se:
Então:
a)
b)
tabela 9.15 - Análise de variância para conglomerados.
C.Variação GL SQ QM
Entre cong 4 931,01918 232,754795
Dentro cong 15 2646,775875 176,451725
Total 19 3.577,795055 188,3050029
Da Tabela 9.15, tem-se:
01362866,03050029,188)14()145(
3050029,188)145(754795,2324)15(ˆ =×−×−×
×−×−××−=d
c) )(ˆ)1(
)(ˆˆˆ
yVm
yVMQ Entre
−
−=d
Da Tabela 9.15, tem-se:
754795,232ˆ =EntreMQ
451725,176ˆ =DentroMQ
3050029,188ˆ)(ˆ == TotalMQyV
14083250,73))((1
������ �
n
i
ik
m
kj
ij yyyy
01362866,03050029,188)145)(14(
14083250,732
)(ˆ)1)(1(
))((2
ˆ 1�
����
��
��
��
�
��� �
yVnmm
yyyyn
i
ik
m
kj
ij
�
b))(ˆ)1)(1(
)(ˆ)1(ˆ)1(ˆ
yVmnm
yVnmMQmn Entre
��
������
01362866,03050029,188)145)(14(
14083250,732
)(ˆ)1)(1(
))((2
ˆ 1�
����
��
��
��
�
��� �
yVnmm
yyyyn
i
ik
m
kj
ij
�
b))(ˆ)1)(1(
)(ˆ)1(ˆ)1(ˆ
yVmnm
yVnmMQmn Entre
��
������
293
Amostragem por conglomerado
Então:
078684034,03050029,188)14(
3050029,188754795,232
)(ˆ)1(
)(ˆˆˆ =
×−−
=−
−=
yVm
yVMQ Entred
d) )(ˆ)(ˆ
)(ˆˆ
yVyV
yV
de
e
+=d
Da Tabela 9.15, tem-se:
É importante mencionar que ao empregar no quesi-to c a expressão ])(ˆ)1[()](ˆˆ[ˆ yVmyVMQ
Entre����
utilizou-
se o valor TotalMQyV ˆ)(ˆ = , pois se fosse usada a fórmula )(ˆ)(ˆ)(ˆ yVyVyV de += o resultado seria o mesmo da expressão
usada no quesito d. As expressões dos quesitos a e b apresentaram os mes-
mos resultados, pois são semelhantes. As expressões dos que-sitos c e d apresentaram valores aproximadamente cinco vezes maiores que os resultados das expressões dos itens a e b, de-monstrando que aquelas (c e d) só são recomendadas para inventários com áreas extensas e com grande intensidade de amostragem.
Para uma visão mais interpretativa dos componentes de variância )(ˆ yVe e )(ˆ yVd , seja o seguinte procedimento para ob-tê-los:
0757675,144
451725,176754795,232ˆˆ)(ˆ �
��
��
m
MQMQyV
DentroEntre
e
451725,176ˆ)(ˆ �� Dentrod MQyV
073877881,0451725,1760757675,14
0757675,14
)(ˆ)(ˆ
)(ˆˆ �
��
�
�
yVyV
yV
de
e�
294
Amostragem em inventário florestal Waldenei Travassos de Queiroz
)(ˆ yVd é a média das variâncias dentro dos conglomerados
Confirmação: 451725,176ˆ)(ˆ == Dentrod MQyV
Da Tabela 9.13, tem-se:
4575,2645
1
=∑=i
iy
Então:
Seja a variância da média dentro do i-ésimo conglomerado:
m
yVyV i
i
)(ˆ)(ˆ =
Então:
]4
)(ˆ
4
)(ˆ
4
)(ˆ
4
)(ˆ
4
)(ˆ[
5
1)(ˆ1)(ˆ
54321
1
1 yVyVyVyVyV
m
yV
nn
yVn
i
i
n
ii
++++== ∑∑
=
=
30866,220.14
5
1
2��
�i
iy
295
Amostragem por conglomerado
Seja então:
Confirmando que:
Conclui-se que o componente de variância entre )(ˆ yVe é a diferença entre a variância da média das médias )(ˆ yV e a média das variâncias das médias dentro de cada conglomerado ).(ˆ
iyV ).
9.5 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ES-TáGIOS COM GRANDEzAS DESIGUAIS
Dada uma amostragem por conglomerados em dois está-gios, onde cada unidade primária seja constituída por Mi uni-dades secundárias ou subparcelas, tal que cada conglomerado possua mi subparcelas.
9.5.1 valores populacionais e estimadores
a) valor médio estimado
Seja iii myy .= o valor médio estimado por subparcela, onde .iy é o total considerando as mi subparcelas enumeradas no i-ésimo conglomerado.
Para estimar o valor médio populacional por subparcela Y existem, como no caso do conglomerado em estágio único, três
1129313,44)4
258626,882(
5
1)(ˆ
1 ��
��
n
yVn
i
i
075768,141129313,4418869968,58
)(ˆ
)(ˆ)(ˆ 1 �����
��
n
yV
yVyV
n
i
i
e
075768,144
451725,176754795,232ˆˆ)(ˆ
)(ˆ)(ˆ 1 ��
��
���
��
m
MQMQ
n
yV
yVyV DentroEntre
n
i
i
e
296
Amostragem em inventário florestal Waldenei Travassos de Queiroz
procedimentos que resultam nas seguintes estimativas das mé-dias:
a1) n
yy
n
ii∑
== 11
a2) ∑
∑
=
==n
ii
n
iii
R
M
yMy
1
1
a3) N
n
iii
Mn
yMy
∑== 1
3
b) variância da média por razão
Considerando que a estimativa é por razão ( Ry ), tem-se:
212
1
12
1
1 ))(
())(
()()(N
n
iii
n
Ii
n
iii
n
ii
n
iii
R Mn
YyME
M
YyMEY
M
yMEyV
∑
∑
∑
∑
∑=
=
=
=
=
−≅
−=−=
Sendo:
N
MM
N
ii
N
∑== 1
Da teoria da estimativa por razão, segundo Cochran (1977), considerando uma amostra por conglomerados em dois está-gios, tem-se que a estimativa da variância para Ry é:
297
Amostragem por conglomerado
Dado:
;1 N
nf = ;2
i
ii M
mf =
1
)(
)(ˆ
2
1
1
2
2 −
−=
∑∑ =
=
i
i
m
iijm
jij
i m
m
yy
yV
i
i
)(2 yV i é a variância das subparcelas dentro do i-ésimo conglomerado.
exercício 9.7
Seja um inventário florestal com 20 conglomerados (C) em dois estágios. A estrutura espacial do conglomerado apresenta uma forma cruz de malta, composta por subparcelas retangula-res de 10 m de largura por 250 m de comprimento. A distância de cada subparcela ao ponto central foi de 100 m. Considerar que algumas subparcelas não foram medidas e que também houve variação no tamanho da unidade primária (variação do grid/grandezas desiguais). Os dados para a variável resposta definida como o volume total de madeira considerando todas as espécies com DAP 45 cm estão apresentados na Tabela 9.16. A Tabela 9.17 mostra os cálculos auxiliares usados para obter as estimativas.
298
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 9.16 - Conglomerados em dois estágios ( m3/ 0,25 ha) com grandezas desiguais.
C Mi mi S1 S2 S3 S41234567891011121314151617181920
196200196200200210196196196230196210196196196196140196196180
43444444424424442443
43,7562,7577,6557,2051,1068,0045,7660,1063,7549,8888,1727,1837,8055,7145,1135,35*****38,7549,1050,10
42,50****73,5067,5043,5075,5034,8078,7079,9055,1767,3034,89*****58,2943,1263,23*****45,1755,1352,70
32,7534,5069,2537,5058,2537,2857,3058,3375,13*****65,2864,30****43,1655,8370,9061,3740,4463,1737,37
57,1066,0139,5038,0258,2564,3363,1737,2742,23*****37,1358,1758,8937,1254,1785,1455,3339,8937,14*****
1055,36 1105,29 1046,63 1030,23
299
Amostragem por conglomerado
tabela 9.17 - Cálculos auxiliares: conglomerados (C) em dois estágios com grandezas desiguais.
C Mi mi
1 196 4 176,10 44,0250 100,161 8628,9 1691264 0,0204082 200 3 163,26 54,4200 300,262 10884,0 2176800 0,0150003 196 4 259,90 64,9750 300,194 12735,1 2496080 0,0204084 200 4 200,22 50,0550 219,283 10011,0 2002200 0,0200005 200 4 211,10 52,7750 49,594 10555,0 2111000 0,0200006 210 4 245,11 61,2775 277,556 12868,3 2702338 0,0190487 196 4 201,03 50,2575 158,497 9850,5 1930692 0,0204088 196 4 234,40 58,6000 287,101 11485,6 2251178 0,0204089 196 4 261,01 65,2525 281,469 12789,5 2506740 0,020408
10 230 2 105,05 52,5250 13,992 12080,8 2778573 0,00869611 196 4 257,88 64,4700 439,277 12636,1 2476680 0,02040812 210 4 184,54 46,1350 320,184 9688,4 2034554 0,01904813 196 2 96,69 48,3450 222, 394 9475,6 1857222 0,01020414 196 4 194,28 48,5700 101,943 9519,7 1865865 0,02040815 196 4 198,23 49,5575 40,614 9713,3 1903801 0,02040816 196 4 254,62 63,6550 438,483 12476,4 2445370 0,02040817 140 2 116,70 58,3500 18,241 8169,0 1143660 0,01428618 196 4 164,25 41,0625 7,994 8048,3 1577457 0,02040819 196 4 204,54 51,1350 120,268 10022,5 1964402 0,02040820 180 3 140,17 46,7233 67,304 8410,2 1513835 0,016667
Total 3922 3869,08 210.048
De acordo com os resultados contidos na Tabela 9.17, tem-se:
.iy iy )(2 yV i ii yM ii yM 2iii Mmf =2
300
Amostragem em inventário florestal Waldenei Travassos de Queiroz
a) valor médio estimado por razão
b) variância do valor médio estimado por razão
Utilizou-se nM devido ao desconhecimento de .NM A partir
da variância da média )(ˆRyV , os cálculos do intervalo de con-
fiança e do limite de erro seguem a metodologia já vista ante-riormente.
9.6 CONGLOMERADOS EM DOIS ESTáGIOS: ANáLISE ES-TATíSTICA CONSIDERANDO A OCORRêNCIA DE TIPOLO-GIAS DIFERENTES NA SUBPARCELA
Seja uma amostra por conglomerado em dois estágios, onde cada conglomerado é constituído por m subparcelas, nas quais foram registradas a ocorrência de uma determinada tipolo-gia. A ocorrência pode acontecer completamente na parcela ou em parte da mesma.
)25,0/(5563,53922.3
048.210 3
1
1 ham
M
yM
yn
i
i
n
i
ii
R ���
�
�
�
�
301
Amostragem por conglomerado
9.6.1 valores populacionais e estimadores
Para estimar o valor médio populacional por subparcela Y , o procedimento mais vantajoso é a estimativa por razão. A estimati-va por razão tem uma pequena tendência, mas torna-se despre-zível quando o número de conglomerados é grande )30( ≥n 30).
a) valor médio estimado por razão
Seja Ai a área de ocorrência dentro do i-ésimo conglomera-do da tipologia de interesse. Pode-se escrever a estimativa por razão do volume médio por subparcela:
∑
∑
=
==n
ii
n
iii
R
A
yAy
1
1
iA = área do i-ésimo conglomerado correspondente à ocor-rência da variável resposta da tipologia considerada;
ijy = valor da variável resposta da tipologia de interesse correspondente a j-ésima subparcela do i-ésimo conglomerado;
m
yy i
i.= é o valor médio estimado do i-ésimo conglomerado;
.iy = valor total referente ao i-ésimo conglomerado.
b) variância estimada do valor médio por razão
Da teoria da estimativa por razão, considerando-se uma amostra por conglomerados em dois estágios, tem-se que a es-timativa da variância de Ry é:
302
Amostragem em inventário florestal Waldenei Travassos de Queiroz
212
1
12
1
1 ))(
())(
()()(N
n
iii
n
Ii
n
iii
n
ii
n
iii
RAn
YyAE
A
YyAEY
A
yAEyV
∑
∑
∑
∑
∑=
=
=
=
=
−≅
−=−=
Utilizou-se N
AA
N
ii
N
∑== 1 no lugar de .1
n
AA
n
ii
n
∑==
De acordo com Cochran (1977), desenvolvendo tem-se:
)(ˆ)1(
1
2)(
)(1
)(ˆ2
1
2
2
22
11
22
1
2
1
2
2yV
m
fA
An
f
n
AyyAyyA
nN
nN
AyV i
n
i i
ii
N
n
i
iR
n
i
iiR
n
i
ii
N
R ����
�
��� ��
�
���
�
;1N
nf � ;2
i
i
iM
mf � ;1
i
m
i
ij
im
y
y
i
���
1
)(
)(ˆ
2
1
1
2
2�
�
�
��
�
�
i
i
m
i
ijm
j
ij
im
m
y
y
yV
i
i
)(ˆ2 yV i é a variância da ocorrência tipológica das subpar-
celas dentro do i-ésimo conglomerado.No caso de ocorrer:
22 ff i = ; :21 nmmm === L
Então:
)(ˆ)1(
1
2)(
)(1
)(ˆ2
1
2
22
211
22
1
2
1
2
2yVA
mAn
ff
n
AyyAyyA
nN
nN
AyV
i
n
i
i
N
n
i
iR
n
i
iiR
n
i
ii
N
R ����
�
����
��
���
�
exercício 9.8
Seja um inventário florestal em dois estágios com 20 con-glomerados mensurados. A estrutura espacial do conglomera-do apresenta uma forma cruz de malta, composta por quatro
303
Amostragem por conglomerado
subparcelas retangulares de 10 m de largura por 250 m de com-primento. A distância de cada subunidade ao ponto central foi de 100 m. Os dados para a variável volume de madeira corres-pondente à tipologia de interesse estão apresentados na Tabe-la 9.18. Os cálculos auxiliares para obter as estimativas estão apresentados na Tabela 9.19.
Ai = variável auxiliar que corresponde à área de ocorrência da tipologia de interesse no conglomerado de 1 ha;
iy = valor médio da variável resposta da tipologia ocorren-te de interesse por subparcela (m3 / 0,25 ha) do i-ésimo conglo-merado;
)(2 yV i é a variância entre as subparcelas do i-ésimo con-glomerado.
tabela 9.18 - Conglomerados (C) em dois estágios por tipologia florestal.
C S1 S2 S3 S4 TOTAL Ai
(ha)
1 43,7500 42,5000 32,7500 57,1000 176,100 1,000002 53,9200 33,0750 24,1500 46,2070 157,352 0,747483 62,1200 58,8000 55,4000 31,6000 207,920 0,800004 58,6200 57,3750 31,8750 32,3170 180,187 0,899955 51,1000 43,5000 58,2500 68,2500 221,100 1,000006 68,0000 75,5000 37,2800 64,3300 245,110 1,000007 32,0320 24,3600 40,1100 54,2100 150,712 0,749708 60,1000 78,7000 58,3300 37,2700 234,400 1,000009 63,7500 79,9000 75,1300 42,2300 261,010 1,00000
10 42,3980 46,8945 30,0645 57,6000 176,957 0,9582911 88,1700 67,3000 65,2800 37,1300 257,880 1,0000012 24,4620 31,4010 57,8700 52,3530 166,086 0,9000013 58,9000 24,1200 24,5750 29,4450 137,040 0,7061014 62,9200 55,3755 41,0020 35,2640 194,562 1,0000015 60,5900 38,8080 50,2470 38,7500 188,395 0,9503916 35,3500 63,2300 70,9000 85,1400 254,620 1,0000017 36,1125 29,1750 46,0275 51,4900 162,805 0,7990418 38,7500 45,1700 40,4400 39,8900 164,250 1,0000019 23,2000 48,5144 55,5896 32,6832 159,987 0,7821820 59,0700 36,8900 26,1590 39,9910 162,110 0,82164
304
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 9.19 - Cálculos auxiliares: conglomerados (C) em dois estágios por tipologia.
C iA iy )(2 yV i ii yA 2)( ii yA ii yA2 2iA )(2
2 yVA ii
1 1,00000 44,0250 100,161 44,0250 1938,20 44,0250 1,00000 100,1612 0,74748 39,3380 176,573 29,4044 864,62 21,9792 0,55873 98,6563 0,80000 51,9800 192,124 41,5840 1729,23 33,2672 0,64000 122,9604 0,89995 45,0468 223,920 40,5396 1643,46 36,4834 0,80990 181,3535 1,00000 55,2750 111,094 55,2750 3055,33 55,2750 1,00000 111,0946 1,00000 61,2775 277,556 61,2775 3754,93 61,2775 1,00000 277,5567 0,74970 37,6780 162,823 28,2472 797,90 21,1769 0,56205 91,51408 1,00000 58,6000 287,101 58,6000 3433,96 58,6000 1,00000 287,1019 1,00000 65,2525 281,469 65,2525 4257,89 65,2525 1,00000 281,46910 0,95829 44,2393 129,958 42,3938 1797,24 40,6254 0,91831 119,34211 1,00000 64,4700 439,277 64,4700 4156,38 64,4700 1,00000 439,27712 0,90000 41,5215 259,349 37,3694 1396,47 33,6324 0,81000 210,07213 0,70610 34,2600 275,644 24,1910 585,20 17,0813 0,49858 137,43014 1,00000 48,6404 162,181 48,6404 2365,89 48,6404 1,00000 162,18115 0,95039 47,0988 110,121 44,7620 2003,64 42,5412 0,90323 99,46516 1,00000 63,6550 438,483 63,6550 4051,96 63,6550 1,00000 438,48317 0,79904 40,7013 99,5590 32,5220 1057,68 25,9865 0,63847 63,56518 1,00000 41,0625 7,9940 41,0625 1686,13 41,0625 1,00000 7,99419 0,78218 39,9968 217,102 31,2847 978,73 24,4703 0,61181 132,82420 0,82164 40,5275 187,932 33,2991 1108,83 27,3599 0,67510 126,872
Total 18,1148 887,860 42.664 826,860 16,6262 3489,4
a) valor médio por razão estimado
ham
A
yA
yn
i
i
n
i
ii
R25,0/0130,49
1148,18
86,887 3
1
1 ���
�
�
�
�
b) variância da média por razão estimada
Dado que:
����
�
��� ��
�
���
�n
i
i
i
ii
N
n
i
iR
n
i
iiR
n
i
ii
N
R yVm
fA
An
f
n
AyyAyyA
nN
nN
AyV
1
2
2
2
22
11
22
1
2
1
2
2)(ˆ)1(
1
2)(
)(1
)(ˆ
305
Amostragem por conglomerado
Como 22 ff i = e :21 nmmm === L
Então:
Portanto:
Utilizou-se n
AA
n
ii
n
∑== 1 devido ao desconhecimento de .NA
Os cálculos para obtenção dos intervalos de confiança e dimensionamento da amostra seguem a metodogia já vista an-teriormente.
9.7 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ES-TáGIOS: ANáLISE ESTATíSTICA CONSIDERANDO A OCOR-RêNCIA DE UMA VARIáVEL AUxILIAR
Seja uma amostra por conglomerado em dois estágios, com cada conglomerado constituído por m subparcelas onde em cada subparcela foi registrado o valor da variável de interesse y e medido também a variável auxiliar (x) que geralmente é corre-lacionada com y.
;1000
201
��N
nf ;
196
422
����M
mf
M
mf
i
i
i196
422 �� ff i
)(ˆ)1(
1
2)(
)(1
)(ˆ2
1
2
22
211
22
1
2
1
2
2yVA
mAn
ff
n
AyyAyyA
nN
nN
AyV
i
n
i
i
N
n
i
iR
n
i
iiR
n
i
ii
N
R ����
�
����
��
���
�
4,348949057,020
)196
41(
1000
20
)19
6262,16013,4986,826013,4920,664.42)(
100020
201000(
9057,0
1)(ˆ
22
2
2
�
��
�
�
�����
�
��
RyV
23 )25,0/(928057848,4052087941,062696993,8105973479,0)(ˆ hamyVR
����
306
Amostragem em inventário florestal Waldenei Travassos de Queiroz
9.7.1 valores populacionais e estimadores
Seja yij a variável de interesse correspondente à j-ésima subparcela do i-ésimo conglomerado e xij a variável auxiliar (co-variável). Da teoria da estimativa por razão, como visto ante-riormente, pode-se escrever o valor médio e sua variância por subparcela, respectivamente:
a) estimativa da razão
∑∑
∑∑
= =
= ==n
i
m
jij
n
i
m
jij
x
y
R
1 1
1 1ˆ
b) valor médio estimado por razão
XRyR ×= ˆ
c) variância estimada do valor médio por razão
.iy = valor total da variável de interesse referente ao i-ési-mo conglomerado;
.ix = valor total da variável auxiliar referente ao i-ésimo conglomerado.
Em uma amostra por conglomerados em dois estágios, quando nmmm === L21 e ,22 ff i = tem-se que a estimativa da variância de Ry é:
����
�
����
��
���
�n
i
i
i
ii
N
n
i
i
n
i
ii
n
i
i
N
R yVm
fx
Xn
f
n
xRyxRy
nN
nN
XyV
1
22
2
.
22
11
2
.
2
1
..
1
2
.
2)(ˆ)1(
)1
ˆˆ2
)((1
)(ˆ
307
Amostragem por conglomerado
Dado que:
;1 N
nf = ;2 M
mf = 1
)(
)(ˆ
2
1
1
2
2 −
−=
∑∑ =
=
m
m
yy
yV
m
iijm
jij
i
)(2 yV i é a variância da variável de interesse das subparce-las dentro do i-ésimo conglomerado.
Os cálculos para obtenção dos intervalos de confiança e dimensionamento da amostra seguem a metodogia já vista an-teriormente.
exercício 9.9
Seja um censo realizado pela Empresa Florestal CIKEL de uma área de 1.392 ha de Floresta Ombrófila Densa consideran-do todas as árvores com DAP ≥ 30 cm, localizada no município de Portel, estado do Pará. Os dados foram georeferenciados. Desta população foram selecionados aleatoriamente 30 conglo-merados com formato cruzado e cada um foi constituído de 8 subparcelas retangulares de 20 m de largura por 50 m de com-primento (0,10 ha) ( ver a forma d de conglomerado no item 9.10). A estrutura espacial de cada conglomerado abrange uma de área de 16 ha (unidade primária). A Tabela 9.20 mostra os dados observados para o volume de madeira (y) e número de ár-vores (x) por parcela. A Tabela 9.21 mostra os cálculos auxiliares para obter as estimativas.
)(ˆ)1()
1
ˆˆ2
)((1
)(ˆ2
1
2
.22
211
2
.
2
1
..
1
2
.
2yVx
Xmn
ff
n
xRyxRy
nN
nN
XyV i
n
i
i
N
n
i
i
n
i
ii
n
i
i
N
R ����
�
����
��
���
�
308
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Sejam os valores populacionais obtidos no censo: O valor médio populacional do volume de madeira consideran-
do todas as árvores com DAP ≥ 30 cm é igual a =Y 57,6968 m3/ha e a variância igual a .)/(6930,1189)( 23 hamyV = (m
3/ha)2. O valor médio populacional do número de árvores consi-
derando todas as árvores com DAP ≥ 30 cm é igual a =NX20,59571 árvores / ha.
Usando t = 2,00. Calcular:
1) Variância da média a partir da subparcela sem conside-rar a variável auxiliar )(1 yV .
2) Variância da média concernente à subparcela conside-rando a estimativa por razão )(2 RyV .
3) Variância da média considerando o conglomerado como unidade de observação (metodologia da amostra simples ao acaso) )(3 yV .
4) Variância da média por razão considerando o conglo-merado como unidade de observação (metodologia da mostra simples por razão) )(4 RyV .
5) Discutir a eficiência dos procedimentos.
309
Amostragem por conglomerado
tabela 9.20 - Dados observados no inventário florestal.
C S VT x C S VT x C S VT x C S VT x C S VT x C S VT x
1 1 6,054 1 6 1 9,696 1 11 1 0,000 0 16 1 10,193 6 21 1 0,000 0 26 1 1,958 1
1 2 3,622 2 6 2 0,000 0 11 2 0,000 0 16 2 23,242 6 21 2 0,000 0 26 2 4,857 2
1 3 6,037 2 6 3 1,251 1 11 3 7,835 2 16 3 3,468 2 21 3 0,000 0 26 3 17,002 3
1 4 7,297 4 6 4 1,047 1 11 4 10,236 4 16 4 1,280 1 21 4 0,000 0 26 4 2,423 1
1 5 5,671 3 6 5 1,844 1 11 5 1,064 1 16 5 9,039 4 21 5 1,850 1 26 5 0,000 0
1 6 21,827 8 6 6 0,000 0 11 6 9,725 3 16 6 5,893 3 21 6 0,000 0 26 6 0,000 0
1 7 4,503 3 6 7 1,425 1 11 7 6,152 1 16 7 13,539 6 21 7 0,000 0 26 7 2,136 1
1 8 8,712 3 6 8 0,000 0 11 8 0,000 0 16 8 2,683 2 21 8 0,000 0 26 8 2,813 2
2 1 11,744 2 7 1 21,803 5 12 1 4,007 2 17 1 10,226 4 22 1 5,176 3 27 1 11,481 5
2 2 13,607 5 7 2 4,304 2 12 2 0,000 0 17 2 0,000 0 22 2 0,000 0 27 2 4,064 2
2 3 11,768 4 7 3 0,000 0 12 3 12,233 4 17 3 11,902 6 22 3 0,000 0 27 3 11,862 4
2 4 0,776 1 7 4 3,995 2 12 4 1,534 1 17 4 0,000 0 22 4 0,000 0 27 4 7,130 3
2 5 13,153 5 7 5 2,263 1 12 5 3,887 1 17 5 20,868 6 22 5 0,000 0 27 5 6,004 2
2 6 2,423 1 7 6 3,799 2 12 6 14,262 3 17 6 2,470 2 22 6 0,000 0 27 6 8,876 4
2 7 4,051 2 7 7 0,000 0 12 7 3,637 2 17 7 3,010 2 22 7 7,778 3 27 7 13,413 6
2 8 0,000 0 7 8 13,284 3 12 8 6,142 3 17 8 2,689 2 22 8 13,118 3 27 8 0,000 0
3 1 1,706 1 8 1 5,718 3 13 1 0,000 0 18 1 1,234 1 23 1 15,844 5 28 1 12,175 5
3 2 0,000 0 8 2 4,566 3 13 2 0,000 0 18 2 4,982 3 23 2 8,277 4 28 2 37,932 4
3 3 0,000 0 8 3 6,427 3 13 3 0,000 0 18 3 4,964 2 23 3 2,878 2 28 3 3,045 1
3 4 3,190 1 8 4 0,000 0 13 4 0,000 0 18 4 0,000 0 23 4 2,265 2 28 4 0,000 0
3 5 2,290 2 8 5 5,974 5 13 5 0,000 0 18 5 13,317 3 23 5 7,575 3 28 5 6,828 3
3 6 3,178 1 8 6 7,603 5 13 6 0,000 0 18 6 4,763 3 23 6 4,320 1 28 6 2,244 1
3 7 0,000 0 8 7 1,759 2 13 7 2,030 1 18 7 0,000 0 23 7 1,689 1 28 7 5,942 3
3 8 5,120 2 8 8 0,000 0 13 8 0,000 0 18 8 1,037 1 23 8 5,735 2 28 8 8,929 3
4 1 13,136 2 9 1 15,739 4 14 1 0,000 0 19 1 8,788 3 24 1 0,000 0 29 1 7,143 3
4 2 11,752 5 9 2 1,224 1 14 2 0,000 0 19 2 8,346 4 24 2 0,000 0 29 2 3,898 2
4 3 0,000 0 9 3 10,721 3 14 3 0,000 0 19 3 1,715 1 24 3 8,206 2 29 3 1,320 1
4 4 7,206 2 9 4 8,803 3 14 4 1,601 1 19 4 0,000 0 24 4 6,258 2 29 4 7,600 3
4 5 7,791 3 9 5 10,691 3 14 5 0,000 0 19 5 0,000 0 24 5 4,497 2 29 5 4,647 2
4 6 0,000 0 9 6 7,896 5 14 6 0,000 0 19 6 5,865 1 24 6 4,965 3 29 6 10,880 4
4 7 20,017 6 9 7 33,005 5 14 7 0,000 0 19 7 11,144 4 24 7 4,005 2 29 7 3,638 1
4 8 17,326 7 9 8 6,130 1 14 8 6,020 3 19 8 2,350 1 24 8 7,649 4 29 8 7,760 4
5 1 11,067 4 10 1 0,000 0 15 1 0,000 0 20 1 3,101 2 25 1 6,510 2 30 1 2,092 1
5 2 5,222 1 10 2 0,000 0 15 2 11,043 3 20 2 0,000 0 25 2 6,791 3 30 2 4,856 1
5 3 0,000 0 10 3 4,213 2 15 3 6,283 2 20 3 6,770 2 25 3 4,262 2 30 3 16,119 4
5 4 1,763 1 10 4 0,000 0 15 4 4,458 2 20 4 14,389 5 25 4 2,887 1 30 4 38,281 7
5 5 7,518 3 10 5 5,696 3 15 5 4,657 2 20 5 0,000 0 25 5 7,666 3 30 5 10,716 2
5 6 3,645 2 10 6 10,314 3 15 6 11,317 4 20 6 13,093 3 25 6 14,333 3 30 6 8,586 3
5 7 1,695 1 10 7 11,751 5 15 7 9,003 2 20 7 8,604 5 25 7 13,384 4 30 7 6,944 2
5 8 0,000 0 10 8 5,967 3 15 8 4,096 1 20 8 0,000 0 25 8 10,346 2 30 8 0,000 0
310
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 9.21 - Cálculos auxiliares: ocorrência de uma variável auxiliar.
C .ix .iy .. ii yx 2.iy 2
.ix )(2 yV i )(ˆ2
2 yVx ii
1 26 63,720 1656,72 4060,24 676 33,810 22855,62 20 57,520 1150,40 3308,55 400 34,840 13936,03 7 15,484 108,39 239,75 49 3,525 172,74 25 77,230 1930,75 5964,47 625 54,090 33806,35 12 30,910 370,92 955,43 144 15,160 2183,06 5 15,260 76,30 232,87 25 10,430 260,87 15 49,450 741,75 2445,30 225 57,180 12865,58 21 32,050 673,05 1027,20 441 9,010 3973,49 25 94,210 2355,25 8875,52 625 90,830 56768,8
10 16 37,940 607,04 1439,44 256 21,470 5496,311 11 35,010 385,11 1225,70 121 20,930 2532,512 16 45,700 731,20 2088,49 256 25,210 6453,813 1 2,030 2,03 4,12 1 0,515 0,514 4 7,621 30,48 58,08 16 4,506 72,115 16 50,860 813,76 2586,74 256 15,080 3860,516 30 69,340 2080,20 4808,04 900 51,960 46764,017 22 51,170 1125,74 2618,37 484 53,840 26058,618 13 30,300 393,90 918,09 169 19,620 3315,819 14 38,210 534,94 1460,00 196 18,780 3680,920 17 45,960 781,32 2112,32 289 34,850 10071,721 1 1,850 1,85 3,42 1 0,428 0,422 9 26,070 234,63 679,64 81 24,910 2017,723 20 48,580 971,60 2360,02 400 21,390 8556,024 15 35,580 533,70 1265,94 225 9,670 2175,825 20 66,180 1323,60 4379,79 400 16,840 6736,026 10 31,190 311,90 972,82 100 30,460 3046,027 26 62,830 1633,58 3947,61 676 20,170 13634,928 20 77,100 1542,00 5944,41 400 145,730 58292,029 20 46,890 937,80 2198,67 400 9,190 3676,030 20 87,590 1751,80 7672,01 400 147,270 58908,0
Total 477 1333,84 25.792,0 75.853,0 9237,0 412.171,0
311
Amostragem por conglomerado
Sejam as seguintes informações preliminares:
tabela 9.22 - Análise de variância da variável de intersse (y).
CV GL SQ QMEntre 29 2068,594106 71,330831
Dentro 210 7011,720746 33,389146Total 239 9080,314852 37,992949
De acordo com as informações da Tabela 9.22 da análise de variância tem-se o valor do coeficiente de correlação intra-conglomerado.
;16010,0
16��
ha
haM ;87
16
1392��
ha
haN ;8�m ;3448,0
87
301
���N
nf
;05,0160
82 ���
M
mf
;/59571,20 haárvoresX N �
;8,0/476568,16 haárvoresX N � haárvoresX N 10,0/059571,2�
;4771
.��
�n
i
ix ;8,0/9,1530
4771
.
haárvoresn
x
X
n
i
i
n ���
��
;/875,19 haárvoresX n � ;84,333.11
.��
�n
i
iy ��
�n
i
iy
1
2
.;06,853.75
;0,92371
2
.��
�n
i
ix ;0,792.251
..��
�
n
i
iiyx �
�
�n
i
iiyVx
1
2
2
.0,171.412)(ˆ
)(ˆ)1)(1(
)(ˆ)1(ˆ)1(ˆyVmnm
yVnmMQmn Entre
��
������
117498097,0992949,37)18()1308(
992949,37)1830(330831,718)130(ˆ ������
���������
312
Amostragem em inventário florestal Waldenei Travassos de Queiroz
1) variância da média a partir da subparcela sem consi-derar a variável auxiliar )(1 yV
a) valor médio estimado por subparcela
hamnm
y
y
n
i
m
j
ij
10,0/557666667,5830
84,333.1 31 1�
���
��� �
hamy /5767,553
�
b) variância sem considerar a variável auxiliar )(1 yV
Sabe-se que:
231
2
1 )10,0/(916353875,81
)(
)(ˆ hamn
yy
yV
n
i
i
��
�
�
��
231
2
1
2 )10,0/(389146,33)1(
)(
)(ˆ hammn
yy
yV
n
i
i
m
j
ij
��
�
�
��� �
É importante notar que (ver Tabela 9.22):
231
2
1 )10,0/(916353875,88
330831,71ˆ
1
)(
)(ˆ hamm
MQ
n
yy
yVEntre
n
i
i
����
�
�
��
231
2
1
2)10,0/(389146,33ˆ
)1(
)(
)(ˆ hamMQmn
yy
yVDen tro
n
i
i
m
j
ij
���
�
�
��� �
Logo:
mn
yVff
n
yVfyV
)(ˆ)1(
)(ˆ)1()(ˆ 2
211
1 ����
308
389146,33)05,01(3448,0
30
916353875,8)3448,01()(ˆ
1�
�����yV
23
1)10,0/(240303788,0)(ˆ hamyV �
hamyVys 10,0/490207902,0240303788,0)(ˆ)(3
1 ���
313
Amostragem por conglomerado
c) intervalo de confiança para o valor médio sem conside-rar a variável auxiliar número de árvores
Limite inferiorhamystyIC /7725,459021,400,25767,55)(: 3
1 ������
Limite superior
d) limite de erro a partir da subparcela desconsiderando a variável auxiliar (LE1).
%64,1710055766667,5
490207902,000,2100
)(1
1��
���
�
�
y
ystLE
2) variância da média por meio da subparcela conside-rando a estimativa por razão )(2 RyV
a) estimativa da razão
796310,2477
84,333.1ˆ
1 1
1 1���
��
��
� �
� �
n
i
m
j
ij
n
i
m
j
ij
x
y
R
b) estimativa do valor médio por razão
hamXRy NR 10,0/75919898,5059571,2796310,2ˆ 3����
hamyR
/591990,573
�
c) estimativa da variância do valor médio por razão
Dado que nmmm === L21 e ,22 ff i = tem-se a estimativa da variância de Ry :
314
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Usando os cálculos contidos na Tabela 9.21:
0,171.412476568,16830
)160
81(
87
30
29
0,9237796310,20,792.25796310,2206,853.75)
8730
3087(
476568,16
1)(ˆ
22
2
22
���
�
�
�����
�
��
RyV
232 )10,0/(079717259,0)(ˆ hamyV R �
23
2 )/(9717259,7)(ˆ hamyV R �
hamys R 10,0/282342449,0079717259,0)( 3
2 ��
y; s R)(2 �������� 3m / ha
d) intervalo de confiança para o valor médio a partir da subparcela considerando a estimativa por razão
Limite inferiorhamystyIC
RR/94519,518234,200,259199,57)(:
3
2������
Limite superiorhamystyIC
RR/23879,638234,200,259199,57)(:
3
2������
e) limite de erro para o valor médio por meio da subparcela considerando a estimativa por razão (LE2)
%80,910075919898,5
282342449,000,2100
)(2
��
�
��
�
�
R
R
y
ystLE
Se considerado desconhecido o valor de NX e utilizando
Nn XX = , ter-se-á:
)(ˆ)1()
1
ˆˆ2
)((1
)(ˆ2
1
2
.22
211
2
.
2
1
..
1
2
.
2yVx
Xmn
ff
n
xRyxRy
nN
nN
XyV
i
n
i
i
N
n
i
i
n
i
ii
n
i
i
N
R ����
�
����
��
���
�
315
Amostragem por conglomerado
Seja o limite de erro para o valor médio por razão a partir da subparcela usando
Nn XX = .
Sendo:
3) variância da média considerando o conglomerado como unidade de observação (metodologia da amostra sim-ples ao acaso) )(3 yV
a) estimativa do valor médio
9,1530
4771 ���
��
n
x
X
n
i
i
n
0,171.4129,15830
)160
81(
87
30
29
0,9237796310,20,792.25796310,2206,853.75)
8730
3087(
9,15
1)(ˆ
22
2
22
���
�
�
�����
�
��RyV
23
2 )10,0/(085603518,0)(ˆ hamyV R �
23
2)/(5603518,8)(ˆ hamyV
R�
hamyVys RR 10,0/292580789,0085603518,0)(ˆ)(3
2 ���
hamn
y
y
n
i
m
j
ij
8,0/4613,4430
84,333.1 31 1���
��� �
hamy /5767,553
�
316
Amostragem em inventário florestal Waldenei Travassos de Queiroz
b) variância do valor médio estimado
Sabe-se que:
23
21
2
.
1
2
.
. )8,0/(6447,57029
30
84,1333853.75
1
)(
)( hamn
n
y
y
yV
n
i
in
i
i
i �
�
��
�
�
��
�
�
23
.)/(6323,891)( hamyV
i�
Então:23.
3 )8,0/(46235552,1230
6447,570)
87
3087(
)(ˆ)()(ˆ ham
n
yV
N
nNyV
i��
��
��
23
3)/(4724305,19)(ˆ hamyV �
) ;8,0/(5302,3)( 3
3hamys � )(
3ys ��������
3/ ham
c) intervalo de confiança para a média considerando o con-glomerado como unidade de observação (metodologia da amos-tra simples ao acaso)
Limite inferiorhamystyIC /7511,464128,400,25767,55)(: 3
3������
Limite superiorhamystyIC /4023,644128,400,25767,55)(: 3
3������
d) intervalo de confiança para a variância
95,0])(ˆ)1(
)()(ˆ)1(
[22
��
���
InfSup
yVnyV
yVnP
��
95,0]6323,891)130(
)(6323,891)130(
[2
975,0
2
025,0
��
���
��yVP
317
Amostragem por conglomerado
Sendo:
Conforme informado no presente exercício, a variância po-pulacional é .)/(6930,1189)( 23 hamyV = (m3 / ha)2. Verifica-se que este valor está contido no intervalo de confiança.
e) limite de erro para o valor médio estimado considerando o conglomerado como unidade de observação. Metodologia da amostra simples ao acaso ( LE3).
4) variância da média por razão considerando o con-glomerado como unidade de observação. metodologia da amostra simples por razão ( )(4 RyV )
a) estimativa do valor médio por razão
b) estimativa da variância da razão
0,162
975,0;29 ��
7,452
025,0;29 ��
95,0]0,16
6323,891)130()(
7,45
6323,891)130([ �
���
�yVP
95,0])/(0835,616.1)()/(8061,565[ 233 ��� hamyVhamP
%88,151004613,44
5302,300,2100
)(3
��
�
��
�
�
y
ystLE
hamXRy nR 8,0/07359186,46476568,16796310,2ˆ 3����
hamyR
/59198983,573
�
)1
ˆˆ2
)((1
)ˆ(ˆ 1
2
.
2
1
..
1
2
.
2 �
���
�
������
n
xRyxRy
nN
nN
XRV
n
i
i
n
i
ii
n
i
i
N
)29
237.9796310,2792.25796310,22853.75)(
8730
3087(
476568,16
1)ˆ(ˆ
2
24
�����
�
��RV
020093329172,0)ˆ(ˆ4 �RV
318
Amostragem em inventário florestal Waldenei Travassos de Queiroz
c) estimativa da variância do valor médio por razão2322
4)8,0/(533675098,220933291720,0476568,16)ˆ(ˆ)(ˆ hamRVXyV
NR�����
23
4 ) ;/(958867341,3)(ˆ hamyV R �
hamysR
8,0/59175221,1533675098,2)(3
4��
ysR
)(4
��������3/ ham
d) intervalo de confiança para o valor médio considerando o conglomerado como unidade de observação. Metodologia da amostra simples ao acaso por razão: )(4 RyV
Limite inferiorhamystyIC
RR/6124,539897,100,259199,57)(:
3
4������
Limite superiorhamystyIC
RR/5714,5619897,100,259199,57)(:
3
4������
e) limite de erro da média por razão considerando o conglo-merado como unidade de observação. Metodologia da amostra simples por razão (LE4)
%91,61000735591,46
59175221,100,2100
)(4
4��
�
��
�
�
y
ystLE
Se considerado desconhecido o valor de NX e utilizando
Nn XX = , ter-se-á:
9,1530
4771 ���
��
n
x
X
n
i
i
n
hamXRy nR 8,0/461329,449,15796310,2ˆ 3����
)1
ˆˆ2
)((1
)ˆ(ˆ 1
2
.
2
1
..
1
2
.
2 �
���
�
������
n
xRyxRy
nN
nN
XRV
n
i
i
n
i
ii
n
i
i
n
)29
237.9796310,2792.25796310,22853.75)(
8730
3087(
9,15
1)ˆ(ˆ
2
24
�����
�
��RV
011425139,0)ˆ(ˆ4
�RV
2322
4 )8,0/(888389391,2011425139,09,15)ˆ(ˆ)(ˆ hamRVXyV nR �����
23
4)/(513108423,4)(ˆ hamyV
R�
hamysR
8,0/699526225,1888389391,2)(3
4��
319
Amostragem por conglomerado
Seja o limite de erro para o valor médio por razão conside-rando o conglomerado como unidade de observação, mas usan-do .Nn XX = Metodologia da amostra simples ao acaso por razão.
Tal que:
5) Discutir a eficiência dos procedimentos
tabela 9.23 - Resultados das estimativas.
Estimativas LE(%) Média (ha) Variância da média (ha)1 ASA(subp)
2 Razão (subp)3 ASA (cong)
4 Razão (cong)
17,64 9,8015,88 6,91
55,576757,592055,576757,5920
24,0303788 7,9717259 19,4724305
3,958867341
A partir dos resultados apresentados na Tabela 9.23, sejam as eficiências calculadas como o quociente entre os limites de erro:
9,1530
4771 ���
��
n
x
X
n
i
i
n
hamXRy nR 8,0/461329,449,15796310,2ˆ 3����
)1
ˆˆ2
)((1
)ˆ(ˆ 1
2
.
2
1
..
1
2
.
2 �
���
�
������
n
xRyxRy
nN
nN
XRV
n
i
i
n
i
ii
n
i
i
n
)29
237.9796310,2792.25796310,22853.75)(
8730
3087(
9,15
1)ˆ(ˆ
2
24
�����
�
��RV
011425139,0)ˆ(ˆ4
�RV
2322
4 )8,0/(888389391,2011425139,09,15)ˆ(ˆ)(ˆ hamRVXyV nR �����
23
4)/(513108423,4)(ˆ hamyV
R�
hamysR
8,0/699526225,1888389391,2)(3
4��
%12,6100576666,55
699526225,100,2100
)(4
��
�
��
�
�
R
R
y
ystLE
haárvoresX n 8,0/9,1530
477��
hamXRynR
8,0/461329,449,15796310,2ˆ 3����
hamyR
/57666,553
�
320
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Os resultados denotam que:
a) a estimativa da média por razão por meio da subparcela é 80% mais eficiente que a análise a partir da subparcela sem considerar a variável auxiliar, pois: EF12 = 1,8000;
b) a estimativa da média quando se considera o conglome-
rado como unidade de observação (metodologia da amostra sim-ples ao acaso) é 11,08% mais eficiente que a análise a partir da subparcela sem considerar a variável auxiliar, pois: EF13 = 1,1118;
c) a estimativa da média por razão quando se considera o conglomerado como unidade de observação (metodologia da amostra simples ao acaso) é 155,28% mais eficiente que a esti-mativa da média a partir da subparcela sem considerar a variá-vel auxiliar, pois: EF14 = 2,5528;
d) a estimativa da média por razão por meio da subparcela
é 62,04% mais eficiente que a estimativa da média quando se considera o conglomerado como unidade de observação sem considerar a variável auxiliar (metodologia da amostra simples), pois: EF32 = 1,6204;
321
Amostragem por conglomerado
e) a estimativa da média por razão quando se considera o conglomerado como unidade de observação (metodologia da amostra simples por razão) é 41,82 % mais eficiente que a esti-mativa por razão a partir da subparcela, pois: EF24 = 1,4182;
f) a estimativa da média por razão quando se considera
o conglomerado como unidade de observação (metodologia da amostra simples por razão) é 129,81 % mais eficiente que a es-timativa a partir do conglomerado como unidade de observação sem considerar a variável auxiliar, pois: EF34 = 2,2981;
Considerando todos os procedimentos, verifica-se que a análise por razão considerando o conglomerado como unida-de de observação (metodologia da amostra simples por razão) apresentou maior precisão.
A maior precisão das estimativas por razão pode ser expli-cada pelo alto valor do coeficiente de correlação entre .ix e ,.iyque é de 0,876463.
Pode ser verificado que o valor médio populacional (57,6968 m3/ha) está dentro dos intervalos de confiança dos quatro métodos utilizados. Observa-se (ver Tabela 9.23) que a estimativa do valor médio por razão (57,5920) está mais próxima do parâmetro populacional que a estimativa sem considerar a variável auxiliar número de árvores (55,5767).
Como em alguns casos o valor médio da variável auxiliar é desconhecido, então, se a amostra é grande pode-se usar a sua estimativa ou proceder a uma dupla amostragem. Neste exercí-cio, o limite de erro da média por razão apresentou o valor 10,53% quando usada a média estimada .10,0/9875,1 haárvoresX
n� Este
limite de erro é 7,44 % maior que o valor de 9,80 % que corres-ponde ao uso de NX .
322
Amostragem em inventário florestal Waldenei Travassos de Queiroz
O limite de erro por razão considerando o conglomerado como unidade de observação (metodologia da amostra simples por razão) usando 9,15=nX = 15,9 árvores/ha apresentou o valor de 6,12%. Este resultado corresponde a 88,57% do valor de 6,91% que se refere ao uso de NX .
O valor do coeficiente de correlação intraconglomerado foi 117498097,0ˆ =d que, sob 0: =doH , resultou não significativo (t = 1,7146), recomendando o uso da amostragem por conglo-merados.
9.8 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ES-TáGIOS PELAS PROPORçõES
Seja um inventário florestal composto de n conglomerados estruturados com m subparcelas, as quais podem ser classi-ficadas em duas categorias, C1 e C0. Admitindo que qualquer subparcela do conglomerado pertença a uma das duas catego-rias, C1 e C0, onde C1 corresponde às subparcelas que possuem o atributo desejado e C0 define os dados que não o possuem.
Seja a seguinte notação:ai = número de subparcelas pertencente à categoria C1 no
conglomerado de ordem i;N = número total de conglomerados da população;n = número de conglomerados amostrado;m = número de subparcelas por conglomerado;
map ii /= é proporção de subparcelas pertencentes à ca-tegoria C1 no conglomerado de ordem i.
9.8.1 valores populacionais e estimadores
a) valor estimado da proporção
323
Amostragem por conglomerado
Para quantificar os resultados, seja a seguinte regra para qualquer subparcela yij da amostra ou da população:
yij = 1, se yij estiver contido em C1;yij = 0, se yij estiver contido em C0;Para a amostra de valores yij , resulta que:
∑=
=m
jiij ay
1
Daí, para o conglomerado de ordem i , tem-se:
m
a
m
yp ii
i ==
ip é a proporção de subparcelas do conglomerado i , per-tencente à categoria C1.
b) variância estimada da proporção
Considerando uma amostra aleatória de n conglomerados, define-se como valor de p a média das observações obtidas de pi na amostra, onde p é uma estimativa da proporção P popula-cional.
Dado que map ii /= , logo: ��
�
���n
i
n
i
i
inm
a
pn
p1
11 .
Então:
1
)(
)(ˆ 1
2
12
1 −
−=∑
∑=
=
nn
pp
yV
n
I
n
Ii
i
324
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Dado que:
)1()(ˆ 1
2 −=
∑=
m
qpmyV
n
Iii
i, sendo
)1()(ˆ 1
2 −=
∑=
mn
qpmyV
n
Iii
Então:
Os cálculos para obtenção dos intervalos de confiança e dimensionamento da amostra seguem a metodogia já vista an-teriormente.
exercício 9.10
Seja uma área plantada com uma espécie florestal no es-paçamento de 5 m x 5 m e constituída por 100 talhões de formato quadrado de 1 ha, donde foi retirada uma amostra de 10 talhões e verificado em cada um deles, por meio de um conglomerado composto por 40 árvores (subparcelas), o número de árvores que apresentavam os sintomas de uma determinada doença. As subparcelas dentro dos conglomerados foram implantadas considerando uma estrutura sistemática com uma equidistância K = 400 / 40 = 10. O objetivo é conhecer a ocorrência dessa ca-racterística. Os dados estão apresentados na Tabela 9.24.
Sabe-se:Área = 100 ha;Área do conglomerado ou unidade primária = 1 ha; Número total de conglomerados ( 100=N );Número de conglomerados amostrado (n =10);
)(ˆ)1()(ˆ)
1()(ˆ
2
21
1
1 yVnm
ffyV
n
fpV
��
��
325
Amostragem por conglomerado
Número de subparcelas por conglomerado (m = 40).
tabela 9.24 - Número de árvores por conglomerado (ai ) com sintomas da doença.
C ai pi = ai / 40 qi piqi
1 0 0,000 1,000 0,000000
2 3 0,075 0,925 0,069375
3 2 0,050 0,950 0,047500
4 4 0,100 0,900 0,090000
5 2 0,050 0,950 0,047500
6 1 0,025 0,975 0,024375
7 2 0,050 0,950 0,047500
8 6 0,150 0,850 0,127500
9 3 0,075 0,925 0,069375
10 1 0,025 0,975 0,024375
Total 24 0,600 0,547500
a) valor estimado da proporção
;600,01
���
n
i
ip ;5475,0
1
���
i
n
i
iqp ;0525,0
1
2��
�
n
i
ip ;24
1
��
�n
i
ia
06,010
600,01 ���
��
n
p
p
n
i
i
ou 06,04010
241�
���
��
nm
a
p
n
i
i
b) variância estimada da proporção
Dado que:
00183333,09
10
6,00525,0
1
)(
)(ˆ
2
1
2
12
1 �
�
��
�
�
��
�
�
n
n
p
p
yV
n
I
n
I
i
i
243333,0)110(10
5475,040
)1()(ˆ 1
2�
��
��
��
��
mn
qpm
yV
n
I
ii
1,0100
101 ���
N
nf
05,0400
202 ���
M
mf
326
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Então:
O intervalo de confiança e o dimensionamento do inventá-rio definitivo são calculados como já visto anteriormente.
9.9 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTá-GIOS PELAS PROPORçõES COM GRANDEzAS DESIGUAIS (Mi)
Dada uma amostragem por conglomerados em dois está-gios, onde cada unidade primária seja constituída por Mi uni-dades secundárias ou subparcelas, tal que cada conglomerado possua mi subparcelas. Admitindo-se que qualquer subparcela do conglomerado, como visto no item 9.8, pertença a uma das duas categorias C1 ou C0.
9.9.1 valores populacionais e estimadores
a) valor estimado da proporção
00183333,09
10
6,00525,0
1
)(
)(ˆ
2
1
2
12
1 �
�
��
�
�
��
�
�
n
n
p
p
yV
n
I
n
I
i
i
243333,0)110(10
5475,040
)1()(ˆ 1
2�
��
��
��
��
mn
qpm
yV
n
I
ii
1,0100
101 ���
N
nf
05,0400
202 ���
M
mf
)(ˆ)1()(ˆ)
1()(ˆ
2
21
1
1 yVnm
ffyV
n
fpV
��
��
243333,04010
)05,01(1,000183333,0)
10
1,01()(ˆ
�
�
���
��pV
8750002227912,08750000577915,00001649997,0)(ˆ���pV
014926194,0)( �ps
327
Amostragem por conglomerado
No caso de ocorrer variação no tamanho do conglomerado (unidade primária), então p é uma estimativa por razão, ou seja:
iii Map /= , logo: ∑
∑
=
==n
ii
n
iii
R
M
pMp
1
1
b) variância estimada da proporção
Dado que:
∑
∑
=
==n
ii
n
iii
R
M
pMp
1
1
Por conseguinte, a estimativa da variância é dada pela ex-pressão:
)(ˆ)1(]
1
2)(
)[(1
)(ˆ2
1
2
2
22
11
22
1
2
1
2
2yV
m
fM
Mn
f
n
MppMppM
nN
nN
MyV i
n
i i
ii
N
n
i
iR
n
i
iiR
n
i
ii
N
R ����
�
����
��
���
�
Tal que:
;1
N
M
M
n
ii
N
∑== )1(
)(ˆ2 −
=i
iiii m
qpmyV
Considerando: 22 ff i = e :21 mmmm n ==== L
)(ˆ)1(]
1
2)(
)[(1
)(ˆ2
1
2
22
211
22
1
2
1
2yVM
Mmn
ff
n
MppMppM
nN
nN
MyV
i
n
i
i
N
n
i
iR
n
i
iiR
n
i
ii
N
R ����
�
����
��
���
�
Os cálculos para obtenção dos intervalos de confiança e dimensionamento da amostra seguem a metodogia já vista an-teriormente.
328
Amostragem em inventário florestal Waldenei Travassos de Queiroz
exercício 9.11
Seja uma adaptação do exercício 9.10 considerando variação no tamanho das unidades primárias e também no número de árvo-res (subparcelas). Os dados estão apresentados na Tabela 9.25.
Dado que:Área total = 100 ha;Número total de conglomerados (N = 100); Número de conglomerados amostrado (n = 10).
tabela 9.25 - Número de árvores (ai ) por conglomerado (C) com sintomas da doença.
C Área Mi mi ia iii map /= qi )1(ˆ2 −= iiiii mqpmV
1 0,9 360 37 0 0,000000 1,00000 0,0000002 0,8 320 35 3 0,085714 0,91429 0,0806723 1,1 440 41 2 0,048780 0,95122 0,0475614 1,2 480 43 4 0,093023 0,90698 0,0863795 0,7 280 33 2 0,060606 0,93939 0,0587126 0,8 320 35 1 0,028571 0,97143 0,0285717 0,9 360 37 2 0,054054 0,94595 0,0525538 1,0 400 40 6 0,150000 0,85000 0,1307699 1,0 400 40 3 0,075000 0,92500 0,07115410 1,4 560 47 1 0,021277 0,978723 0,021277
Total 9,8 3920 24
��
�n
i
iM1
3920
��
�n
i
iM1
20,000.600.1
��
�n
i
ii pM1
03,241
400100
000.401���
��
N
M
M
N
i
i
N
��
�n
i
ii pM1
2 0,009.97
��
�n
i
iipM
1
293,598.8)(
9,054.2)(ˆ)1(2
1
2
2
��
��
yVm
fMi
n
i i
ii
329
Amostragem por conglomerado
a) valor médio estimado por razão de P
061714,03920
92,241
1
1 ���
�
�
�
�
n
i
i
n
i
ii
R
M
pM
p
b) variância estimada por razão de pR
)(ˆ)1(]
1
2)(
)[(1
)(ˆ 2
1
2
2
22
11
22
1
2
1
2
2yV
m
fM
Mn
f
n
MppMppM
nN
nN
MyV i
n
i i
ii
N
n
i
iR
n
i
iiR
n
i
ii
N
R ����
�
����
��
���
�
9,054.240010
1,0
)9
000.600.1061487,0009.97061487,0293,598.8)(
10010
10100(
400
1)(ˆ
22
2
2
��
�
�����
�
��pV
1930001827423,0250000128431,0)043012,302)(10010
10100(
400
1)(ˆ
2��
�
��pV
013518,0)( �ps
Os cálculos para obtenção dos intervalos de confiança e dimensionamento da amostra seguem a metodogia já vista an-teriormente.
9.10 ESTRUTURAS DE CONGLOMERADOS EM INVENTá-RIOS FLORESTAIS
A configuração estrutural dos conglomerados pode ser or-ganizada de diversas formas, tamanhos e distribuições espa-ciais na floresta. Entretanto, para se definir a forma estrutural
��
�n
i
iM1
3920
��
�n
i
iM1
20,000.600.1
��
�n
i
ii pM1
03,241
400100
000.401���
��
N
M
M
N
i
i
N
��
�n
i
ii pM1
2 0,009.97
��
�n
i
iipM
1
293,598.8)(
9,054.2)(ˆ)1(2
1
2
2
��
��
yVm
fMi
n
i i
ii
330
Amostragem em inventário florestal Waldenei Travassos de Queiroz
amostral (conglomerado) em inventários de florestas naturais, as seguintes informações são importantes, como subsídios para se aproximar da estrutura conglomerada ideal:
a) a razão entre os custos de penetração e medição das subparcelas e o custo de reconhecimento e penetração nos con-glomerados;
b) previsão aproximada do valor esperado do coeficiente de correlação intraconglomerado;
c) a área da subunidade.
A diversidade de formas ou estruturas de conglomerados com aplicação na área florestal é bastante ampla. A Figura 9.1 apresenta algumas formas (a, b, c, d) que podem ser utilizadas:
(a) (b) (c) (d)
Figura 9.1 - Formas estruturais de conglomerados (a, b, c, d).
Péllico Netto (1971) realizou um inventário florestal em uma área de 160.980 ha, localizada na região do Alto Turi, município de Santa Helena, no estado do Maranhão. A unidade amostral apresentou uma forma conglomerada, denominada cruz de mal-ta (forma a), onde cada subparcela tinha uma área de 0,25 ha. A distância de cada subparcela em relação ao ponto central do conglomerado foi de 10 m.
Bolfarine e Bussab (2005) citam que uma inconveniência no uso da amostragem em conglomerados é que as subparcelas
331
Amostragem por conglomerado
dentro do conglomerado tendem a ter valores mais homogêneos para as variáveis medidas. Queiroz (1998) explica que o uso de pequenas distâncias entre as subparcelas aumenta o grau de dependência entre as mesmas, pois o coeficiente de correlação intraconglomerado tende a crescer.
Queiroz (1977) estudou a forma estrutural do conglomera-do cruz de malta com o objetivo de pesquisar 25 tamanhos di-ferentes de subparcelas, pelo Método da Curvatura Máxima, vi-sando definir o tamanho ideal. A seguir uma apresentação mais detalhada deste trabalho.
Para estudar o tamanho ótimo da subparcela e a distância ideal dessa ao centro do conglomerado foram consideradas as seguintes variáveis respostas: Vt: Volume de madeira sem cas-ca das árvores com DAP ≥ 25 cm considerando as 167 espécies ocorrentes na área; V1: Volume de madeira sem casca congre-gando somente as espécies pertencentes à classe I que são as espécies com mercado internacional garantido que, segundo Queiroz (1977), no ano de 1977 correspondia a um total de 14 espécies, e Vm: Volume de madeira sem casca somente para a espécie maçaranduba (Manilkara huberi (Ducke). Standl).
O método utilizado para obter o tamanho ideal da subpar-cela, denominado de curvatura máxima, foi proposto por Federer (1955), consistindo em obter um índice que estime a variabilida-de, como a variância ou coeficiente de variação para cada tama-nho de subparcela. Segundo Chacin Lugo (1977), o método da curvatura máxima foi o primeiro a ser utilizado na obtenção do tamanho ideal de parcelas experimentais. Este método consiste em utilizar ensaios de uniformidade compreendendo um conjun-to de unidades básicas.
A partir dos coeficientes de variação (CV) obtidos para cada tamanho de parcela, uma curva é então traçada através
332
Amostragem em inventário florestal Waldenei Travassos de Queiroz
das coordenadas resultantes, onde o tamanho ótimo da parcela localiza-se na região de máxima curvatura. Este tamanho é de-terminado de forma visual, adotando-se como tamanho ideal o valor correspondente à abscissa do ponto naquela região.
O tamanho ideal escolhido, localizado na região de máxi-ma curvatura, foi de 0,32 ha. Definido o tamanho da subparcela em 0,32 ha, foram analisados os efeitos na precisão do inven-tário, quando as mesmas estiverem afastadas do ponto central, para 17 distâncias diferentes. Os resultados mostraram que a distância das subparcelas ao ponto central não deve ser inferior a 50 metros para um tamanho de subparcela de 0,32 ha, entre-tanto, os resultados obtidos recomendam que uma distância de 100 m seria melhor.
Os resultados demonstraram que o número de subparcelas aumenta com a diminuição do seu tamanho, o que pode ser per-cebido quando o tamanho é igual a 0,12 ha, onde os coeficientes de correlação intraconglomerado, para as três variáveis respos-tas estudadas, variaram entre os valores de 0,055 a 0,087; e, consequentemente, o número de subparcelas variou de 5,596 a 7,193; denotando ser eficiente uma formatação conglomerada na forma cruzada, mas apresentando oito subparcelas.
Analisando-se a Figura 9.2, com base nas três variáveis respostas referentes aos volumes das espécies em estudo, veri-fica-se que existe uma relação inversamente proporcional da va-riabilidade dos valores do coeficiente de variação em função do tamanho das subparcelas, ou seja, à medida que se aumenta o tamanho da subparcela diminui o valor do coeficiente de variação. Nesse caso, o tamanho da subparcela considerado ideal foi ob-tido por meio de análise visual, com localização centralizada na região de máxima curvatura, correspondendo à soma do total de oito unidades básicas (subsubparcelas), perfazendo uma magni-
333
Amostragem por conglomerado
tude de 0,32 ha. Todavia, verifica-se uma tendência de estabili-zação da curva a partir do tamanho de 0,2 ha, e que o tamanho correspondente a 0,25 ha também pode ser uma boa escolha.
Figura 9.2 - Gráfico de dispersão do coeficiente de variação em função do tamanho das subparcelas para o inventário florestal do Tapajós, município de Santarém-PA, em 1977.
De acordo com as três variáveis respostas referentes aos volumes das espécies em estudo, observou-se que existe uma relação diretamente proporcional da variabilidade do coeficien-te de correlação intraconglomerado em função do tamanho das subparcelas, ou seja, à medida que aumenta o tamanho da subparcela cresce o seu valor, conforme mostra a Figura 9.3. Os valores dos coeficientes de correlação intraconglomerado, considerando um tamanho de subparcela ideal de 0,32 ha, para as três variáveis: Vt (Volume das 167 espécies), d = 0,213; V1 (Volume das espécies da classe I), d = 0,276 e Vm (Volume da espécie Maçaranduba), d = 0,214, ficaram bem abaixo de 0,4, indicando ser um tamanho de subparcela adequado.
050
100150200250300350400450500
0,00 0,20 0,40 0,60 0,80 1,00 1,20
Área da subparcela (ha)
Co
efic
ien
te d
e v
aria
ção
Vt: Volume das 167 espécies V1: Volume das espécies da classe I Vm: Volume da Maçaranduba
334
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Figura 9.3 - Gráfico de dispersão para os valores do coeficiente de correla-ção intraconglomerado em função do tamanho das subparcelas para o inven-tário florestal do Tapajós, município de Santarém-PA, em 1977.
Considerando as três variáveis respostas referentes aos volumes das espécies em estudo, constatou-se que existe uma relação inversamente proporcional da variabilidade do número de subparcelas em função do seu tamanho, ou seja, à medida que este aumenta a sua quantidade diminui, estabilizando-se em torno de quatro para 0,32 ha, como apresenta a Figura 9.4. Os resultados mostram que os números de subparcelas corres-pondente ao tamanho de 0,32 ha, para as variáveis em estudo, foram: Vt (Volume das 167 espécies), m = 3,324; V1(Volume das espécies da classe I), m = 2,801; e Vm (Volume da espécie Maçaranduba), m = 3,314.
-0,1
0,0
0,1
0,2
0,3
0,4
0,5
0,00 0,20 0,40 0,60 0,80 1,00 1,20
Área da subparcela (ha)
Co
rrel
ação
in
trac
on
glo
mer
ado
Vt: Volume das 167 espécies V1: Volume das espécies da classe I Vm: Volume da Maçaranduba
335
Amostragem por conglomerado
Figura 9.4 - Gráfico de dispersão da variação do número de subparcelas em função do tamanho das subparcelas para o inventário florestal do Tapajós, município de Santarém-PA, em 1977.
A Figura 9.5 apresenta, para as três variáveis respostas, a variabilidade do coeficiente de correlação intraconglomerado em função da distância das subparcelas ao centro do conglomera-do. Os valores do coeficiente de correlação intraconglomerado considerando uma distância de 50 m das subparcelas ao centro do conglomerado e com um tamanho 0,32 ha apresentaram os seguintes resultados: Vt = 0,130; V1 = 0,215 e Vm = 0,169. Es-tes valores denotam que o uso de subparcelas com tamanho de 0,32 ha e distantes 50 m do centro do conglomerado cruz de malta estão dentro do limite aceitável por atenderem à condição
4,0≤d .
0
5
10
15
20
25
0,00 0,20 0,40 0,60 0,80 1,00 1,20
Área da subparcela (ha)
Nú
mero
de s
ub
parc
ela
s
Vt: Volume das 167 espécies V1: Volume das espécies da classe I Vm: Volume da Maçaranduba
336
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Figura 9.5 - Gráfico de dispersão da variação do coeficiente de correlação intraconglomerado em função da distância para o inventário florestal do Ta-pajós, município de Santarém, em 1977.
A Figura 9.6 apresenta, para as três variáveis respostas, a variabilidade do número de subparcelas ideal em função da distância das subparcelas ao centro do conglomerado. Os va-lores do coeficiente de correlação intraconglomerado para uma distância de 110 m das subparcelas ao centro do conglomerado, para o tamanho de subparcela de 0,32 ha, apresentaram os se-guintes resultados: Vt = 3,611; V1 = 2,933; e Vm = 2,905. Estes valores denotam que é aceitável estruturar um conglomerado cruz de malta com subparcelas com tamanho de 0,32 ha e dis-tantes 110 m do centro, pois 4,0≤d .
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0 50 100 150 200 250 300 350 400
Distância (m)
Co
rrel
ação
in
trac
on
glo
mer
ado
Vt: Volume das 167 espécies V1: Volume das espécies da classe I Vm: Volume da Maçaranduba
337
Amostragem por conglomerado
Figura 9.6 - Variação do número de subparcelas em função da distância ao centro do conglomerado.
Os resultados apresentados demonstram que o uso do for-mato conglomerado cruz de malta com subparcelas com tama-nhos de 0,25 ha ou 0,32 ha em Inventários Florestais na Amazô-nia é recomendável, por outro lado, se a área da subparcela for dimensionada para 0,10 ha, o conglomerado deverá ser estrutu-rado com oito subparcelas.
As experiências na realização de Inventários Florestais na Amazônia recomendam que a distância das subparcelas ao cen-tro do conglomerado cruz de malta não deve ser inferior a 50 m, mas, ressalta-se que a distância recomendada é 100 m para um tamanho de subparcela de 0,25 ha. Os resultados demonstram também que se houver a diminuição do tamanho da subparcela, o seu número deverá ser aumentado, o que pode ser percebido quando o tamanho da subparcela é igual a 0,12 ha, onde os valores da correlação intraconglomerado, para as três variáveis respostas, variaram de 0,055 a 0,087 e, consequentemente, o número de subparcelas ideal ficou no intervalo de 5,596 a 7,193; concluindo-se ser eficiente estruturar, para inventários florestais
02468
101214161820
0 100 200 300 400
distância
Nú
mer
o d
e su
bu
nid
ades
Vt
V1
Vm
338
Amostragem em inventário florestal Waldenei Travassos de Queiroz
na Amazônia, uma formatação conglomerada cruzada ampliada, ou seja, apresentando uma composição com oito subparcelas de 0,10 ha (Figura 9.7).
Figura 9.7 - Representação esquemática da unidade conglomerada cruz de malta e da unidade cruzada com oito subparcelas do inventário florestal da Flona Tapajós, município de Santarém, em 1977.
Flores (2010) estudou na área de manejo florestal susten-tável de 1400 ha, pertencente à empresa madeireira Cikel Brasil Verde Madeiras Ltda., em região de floresta ombrófila densa, localizada no Alto Pacajá, município de Portel, estado do Pará, a forma estrutural conglomerada cruzada com oito subparcelas (Forma expressa na Figura 9.7) com o objetivo de pesquisar cinco tamanhos diferentes de subparcela, pelo Método da Cur-vatura Máxima, visando definir o tamanho ideal. A seguir uma apresentação mais detalhada deste trabalho.
Para estudar o tamanho ótimo da subparcela e a distância ideal desta ao centro do conglomerado foram consideradas as seguintes variáveis respostas: VT: Volume de madeira com cas-ca das árvores com DAP ≥ 30 cm considerando as 77 espécies ocorrentes na área; VO: Volume de madeira com casca congre-
339
Amostragem por conglomerado
gando somente as 10 espécies de maior ocorrência; VC: Volume de madeira com casca das dez espécies com mercado interna-cional garantido pela Empresa Cikel Brasil Verde Madeiras Ltda.
O tamanho ideal escolhido, localizado próximo à região de máxima curvatura, foi de 0,10 ha. Definido o tamanho da subpar-cela em 0,10 ha, foram analisados os efeitos na precisão do inventário para cinco diferentes distâncias entre as subparcelas, os resultados mostraram que a distância entre as subparcelas deve ser de 50 m, ou seja, o autor confirmou que a formatação conglomerada cruzada com oito subparcelas de 0,10 ha é reco-mendável (Figura 9.7).
Pinheiro (2011) aplicou a estrutura conglomerada cruzada com oito subparcelas de 0,8 ha, formato apresentado na Figura 9.7, em um inventário florestal localizado no município de Portel, estado do Pará, considerando a variável resposta volume com DAP ≥ 30 cm para todas as espécies ocorrentes. Referido autor obteve para o coeficiente de correlação intraconglomerado o va-lor de 0,1770; o qual está dentro do limite aceitável por atender a condição 4,0≤d .
9.11 AMOSTRAGEM POR CONGLOMERADOS EM TRêS ES-TáGIOS
Seja uma população florestal dividida em N unidades de área denominadas primárias ou conglomerados de conglome-rados, tal que cada unidade primária ou conglomerado de con-glomerados é subdividida em M unidades denominadas secun-dárias ou conglomerados e cada unidade secundária ou con-glomerados é divida em U unidades denominadas terciárias ou subparcelas. Denomina-se amostragem em três estágios por-que a amostra é selecionada em três etapas. A primeira etapa
340
Amostragem em inventário florestal Waldenei Travassos de Queiroz
consiste em selecionar n unidades primárias dentre as N unida-des primárias. A segunda consiste em selecionar m unidades secundárias dentre as M unidades secundárias. Na terceira eta-pa selecionam-se u unidades terciárias dentre as U unidades terciárias existentes.
Em florestas tropicais, quando a acessibilidade é difícil, é vantajosa a aplicação da amostragem por conglomerados. Em in-ventários realizados em áreas de difícil acesso, em que o custo de localização da unidade de amostra é alto, o uso da amostragem em três estágios possibilita a redução do custo do levantamento.
As n unidades primárias serão denominadas de conglome-rados de conglomerados, pois em cada unidade primária ter-se-á m conglomerados. As m unidades secundárias serão denomi-nadas de conglomerado, pois ter-se-á apenas um conglomerado em cada unidade secundária. As u unidades terciárias serão de-nominadas de subparcelas dentro de cada conglomerado.
O confronto das variações entre os conglomerados de con-glomerados, entre conglomerados dentro dos conglomerados de conglomerados e entre subparcelas dentro dos conglomerados é que revelará a eficiência, em termos de precisão estatística, da aplicação da amostragem por conglomerados em três estágios. A amostra por conglomerados em três estágios será tanto mais precisa quanto maior for o componente de variância entre os conglomerados dentro dos conglomerados de conglomerados e entre as subparcelas dentro dos conglomerados e menor for o componente entre os conglomerados de conglomerados.
Considerando que os conglomerados de conglomerados (unidades primárias), os conglomerados (unidades secundárias) dentro dos conglomerados de conglomerados e as subparcelas (unidades terciárias) dentro dos conglomerados estão dispostas sistematicamente, a tendência no cálculo do erro padrão pode
341
Amostragem por conglomerado
ser considerada desprezível no caso de inventários florestais, pois, normalmente, os valores das variáveis respostas são orde-nados por algum critério objetivo, ou seja, sucedem-se em uma ordem obedecendo às leis da natureza florestal, podendo-se através da análise de variância ter uma aproximação satisfatória da estimativa da variância da população.
9.11.1 valores populacionais e estimadores
Sem perda de generalidade, será apresentado o caso mais simples, quando uma amostra de n conglomerados de conglo-merados selecionados de um total de N contém o mesmo nú-mero m de conglomerados, assim como todos m conglomera-dos selecionados de um total de M terão o mesmo número u de subparcelas de um total U.
Para formular os parâmetros populacionais e os respecti-vos estimadores, utilizar-se-á a seguinte notação.
N = número total de conglomerados de conglomerados ou unidades primárias, possível de ser alocado na área florestal a ser inventariada, respeitando-se a sua forma estrutural;
M = número total de unidades secundárias ou conglome-rados, possível de ser alocado dentro de cada unidade primária ou conglomerados de conglomerados;
U = número total de unidades terciárias ou subparcelas do conglomerado, possível de ser alocado dentro de cada unidade secundária ou conglomerado;
n = número de unidades primárias ou conglomerados de conglomerados amostrado;
m = número de unidades secundárias ou conglomerados amostrado dentro de cada unidade primária ou conglomerados de conglomerados;
342
Amostragem em inventário florestal Waldenei Travassos de Queiroz
u = número de unidades terciárias ou subparcelas amos-trado dentro de cada conglomerado;
ijky = valor da variável resposta correspondente à k-ésima subparcela do j-ésimo conglomerado, o qual pertence ao i-ésimo conglomerado de conglomerados.
a) valores médios por unidade terciária ou subparcela
a1) valores médios populacionais por unidade terciária ou subparcela
a2) valores médios amostrais por subparcela ou unidade de terceiro estágio
b) valor total b1) valor total populacional
YNMUY =
b2) valor total estimado
yNMUY =ˆ
;1 1 1
NMU
y
Y
N
i
M
j
U
k
ijk���� � �
� ;1 1
MU
y
Y
M
j
U
k
ijk
i
��� �
�U
y
Y
U
k
ijk
ij
��� 1
;1 1 1
nmu
y
y
n
i
m
j
u
kijk���
� � �� ;
1 1
mu
y
y
m
j
u
k
ijk
i
��� �
�u
y
y
u
k
ijk
ij
��
�1
343
Amostragem por conglomerado
c) variância populacional por subparcela e seu estimador
;1
)(
)( 1 1 1
2
−
−=∑∑∑
= = =
NMU
Yy
yV
N
i
M
j
U
kijk
1
)(
)(ˆ 1 1 1
2
−
−=∑∑∑
= = =
nmu
yy
yV
n
i
m
j
u
kijk
9.11.2 parâmetros populacionais e seus estimadores atra-vés da análise de variância
a) variância a partir dos componentes de variância
A variância populacional e seu estimador, a partir dos com-ponentes de variância, são obtidos respectivamente pelas ex-pressões:
1
)()1()()1()()(
�
�����
NMU
yVNMUyVNMUyVyV C CC
d d
1
)(ˆ)1()(ˆ)1()(ˆ)(ˆ
�
���
��
nmu
yVnmuyVnmuyVyV CCC
dd
Seja a verificação pela análise de variância considerando o esquema para ensaios em classificação hierárquica (Tabelas 9.26 e 9.27):
ijkijiijk ecccYy ����
Y é a média geral fixa, onde YYE =)( e 22 )( YYE =
ijky é o valor da variável resposta correspondente à k-ésima subparcela dentro do j-ésimo conglomerado dentro do i-ésimo conglomerados de conglomerados;
cci: com ni ,,2,1 L= é o efeito dos conglomerados dos conglo-merados (unidades primárias), tal que E(cci) = 0 e E(cci
2) = Vcc (y);cij: com mj ,,2,1 L= é o efeito do conglomerado j dentro do
conglomerado de conglomerado i, quando E(cij) = 0 e E(cij2) = Vc (y);
ijke : uk ,,2,1 L= é o efeito da subunidade k dentro do con-
344
Amostragem em inventário florestal Waldenei Travassos de Queiroz
glomerado j, dentro do conglomerado de conglomerados i, ou erro aleatório para 0)( =ijkeE e E(e2 ) = Vdd (y).
tabela 9.26 - Análise de variância em classificação hierárquica.
Causas de Variação G.L. SQ QMEntre conglomerados de conglomerados
1−n�
�
�n
i
i yyum1
2)( 11
�
�
n
SQV CC
Entre conglomerados dentro dos conglomerados de conglomerados
)1( −mn��
� �
�n
i
m
j
iij yyu1 1
2)()1(
.
2�
�
mn
SQV
CCdC
Entre subunidades dentro dos conglomerados dentro dos conglomerados de conglomerados
)1( �unm ∑∑∑= = =
−n
i
m
j
u
kijijk yy
1 1 1
2)(
Total 1−nmu ∑∑∑= = =
−n
i
m
j
u
kijk yy
1 1 1
2)(1
4
�
�
nmu
SQV Total
���� � �
��n
i
m
j
u
k
ijkTotal CySQ1 1 1
2
nmu
y
C
n
i
m
j
u
k
ijk���� � �
�1 1 1
2)(
��
��
n
i
iCC Cyju
SQ1
2..
1
� ��
��n
i
n
i
iijCCdC yju
yu
SQ1
2
..
2
..
11
� ����� �� �
��
n
i
n
i
m
j
ij
m
j
u
k
ijkCCdCdSub yu
ySQ1 1
2
.
1 1
2
..
1
345
Amostragem por conglomerado
tabela 9.27 - Componentes de variância.
Causas de Variação G.L. QM E(QM) FEntre conglomerados deconglomerados
1−N 1V )()()( yMUVyUVyV CCCdd ��
2
1
V
V
Entre conglomerados dentro dos conglomerados de conglomerados
)1( −MN 2V )()( yUVyV Cdd �3
2
V
V
Entre subunidadesdentro dos conglomerados dentro dos conglomerados de conglomerados
)1( �UNM 3V )(yVdd
Total 1−NMU 4V1
)()1()()1()(
�
���
�
NMU
yVNMUyVNMUyV C CC
dd
O termo E(QM) significa esperança do quadrado médio. Tem-se:
VCC (y) é o componente de variância entre os conglomera-dos de conglomerados;
VC (y) é o componente de variância entre os conglomerados dentro dos conglomerados de conglomerados;
Vdd (y) é o componente de variância entre subparcelas den-tro dos conglomerados dentro dos conglomerados de conglome-rados.
Não obstante, considerando que a amostra por conglome-rados, geralmente, é aplicada às populações extensas, pode-se considerar que:
Então, se V (y) = QMTotal , tem-se que:
1)1()1( ����� NMUNMUNMU
)()()()( yVyVyVyV ddCCC ���
346
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Dado que:
1
)(
)(ˆ 1
2
1 1
−
−=∑∑∑
= = =
nmu
yy
yV
n
i
m
j
u
kijk
Então a variância estimada através da análise de variância,
será:
Substituindo-se os componentes de variância correspon-dentes e considerando a população infinita.
Tem-se:
Tal que:
b) desvio padrão a partir dos componentes de variância
b1) desvio padrão populacional a partir dos componentes de variância
b2) desvio padrão estimado considerando os componentes de variância
1
ˆ)1(ˆ)1(ˆ)1()(ˆ ...
�
�����
�
nmu
MQunmMQmnMQnyV
CCdCdSubCCdCCC
1)1()1( ����� nmunmunmu
)(ˆ)(ˆ)(ˆ)(ˆ yVyVyVyV ddCCC ���
,ˆˆ
)(ˆ 21
mu
VVyVC C
�
�,
ˆˆ)(ˆ 32
u
VVyVC
�
� CCdCdSubdd QMyV ..)(ˆ�
)()()()( yVyVyVyS ddCCC ���
)(ˆ)(ˆ)(ˆ)( yVyVyVys ddCCC ���
347
Amostragem por conglomerado
c) coeficiente de variação
c1) coeficiente de variação populacional
c2) coeficiente de variação estimado
100)(
%ˆ ×=y
ysVC
d) variância da média por subparcela (unidade terciária)
d1) variância da média populacional por subparcela (unida-de terciária)
Do modelo matemático de um levantamento em três está-gios ijkijii jk ecccy ���� Y , tem-se:
Sendo:
100)(
% ��
Y
ySCV
)(1
)(1
)(1
)()( 2
3
2
2
1
11 1 1yV
nmu
fyV
nm
fyV
n
f
nmu
y
VyV
n
i
m
j
u
k
ijk�
��
��
��
���� � �
1
)(
)(1
2
1�
�
�
��
N
yy
yV
N
i
i
)1(
)(
)(1 1
2
2�
�
�
��� �
MN
yy
yV
N
i
M
j
iij
)1(
)(
)(1 1 1
2
3�
�
�
���� � �
UNM
yy
yV
N
i
M
j
U
k
ijijk
348
Amostragem em inventário florestal Waldenei Travassos de Queiroz
d2) variância da média estimada por subparcela unidade y
Se n conglomerados de conglomerados são selecionados ao acaso e se m conglomerados são também retirados aleato-riamente dentro dos conglomerados de conglomerados e u su-bunidades também são selecionadas aleatoriamente dentro dos conglomerados, tem-se que y é uma estimativa sem tendência de Y e sua variância é:
)(ˆ)1()(ˆ)1(
)(ˆ1)()(ˆ
3321
221
111 1 1 yV
nmu
fffyV
nm
ffyV
n
f
nmu
y
VyV
n
i
m
j
u
kijk −
+−
+−
==∑∑∑
= = =
Sendo:
;1
)()(ˆ 1
2
1 −
−=∑
=
n
yyyV
n
ii
;)1(
)(
)(ˆ 1 1
2
2 −
−=∑∑
= =
mn
yy
yV
n
i
m
jiij
Para populações infinitas, usando-se os componentes de variância, tem-se:
e) erro padrão
e1) erro padrão populacional
)()( yVyS =
)1(
)(
)(ˆ 1 1 1
2
3�
�
�
���� � �
unm
yy
yV
n
i
m
j
u
k
ijijk
nmu
yV
nm
yV
n
yVyV ddCCC )(ˆ)(ˆ)(ˆ
)(ˆ ���
349
Amostragem por conglomerado
e2) erro padrão estimado )(ˆ)( yVys =
f) intervalo de confiança
f1) intervalo de confiança para a média populacional (Y )
)]()([22
ystyYystyP aa +≤≤− =1-a
f2) intervalo de confiança para o valor total populacional (Y)
)](ˆ)(ˆ[22
ysNMUtYYysNMUtYP aa +≤≤− =1-a
:)(ys valor na unidade de área da subparcela do conglo-merado
g) intensidade de amostragem e limite de erro
Seja )(ystE ×= a semiamplitude do intervalo de confiança. Definindo a semiamplitude do intervalo de confiança em percen-tagem da média, tem-se: E = LE ,yLEE ×= tal que LE é denominado Limite de Erro ou Margem de Erro.
Dado que yLEystE ���� )( , conclui-se que:
y
ystLE
)(%
�
�
De )(ystE ×= , tem-se: ).(ˆ22 yVtE ×= ). Logo:
])(ˆ)(ˆ
)(ˆ[1 22
mu
yV
m
yVyVt
nE ddC
CC ���
])(ˆ)(ˆ
)(ˆ[2
2
mu
yV
m
yVyV
E
tn ddC
CC���
])(ˆ)(ˆ
)(ˆ[)( 2
2
mu
yV
m
yVyV
yLE
tn ddC
CC ��
�
�
))(ˆ)(ˆ
)(ˆ(2
2
2
mu
yV
m
yVyV
yn
tLE ddC
CC ���
100])(ˆ)(ˆ
)(ˆ[1
)(% ����
mu
yV
m
yVyV
ny
tLE ddC
CC
])(ˆ)(ˆ)(ˆ
[)(ˆ 222
nmu
yV
nm
yV
n
yVtyVtE d dCCC
����
350
Amostragem em inventário florestal Waldenei Travassos de Queiroz
h) dimensionamento da amostra considerando os custos
Seja C = c1n + c2nm + c3nmu a função custo linear mais simples, sendo:
C = custo de medição de campo do inventário florestal;nc1 = custo de penetração e implantação dos conglomera-
dos de conglomerados;c2nm = custo de penetração e implantação dos conglome-
rados;nmuc3 = custo de medição das subunidades.
Considerando grandes áreas (populações infinitas) pode-se tornar mínimo o custo, para:
])(ˆ)(ˆ
)(ˆ[2
2
mu
yV
m
yVyV
E
tn ddC
CC ���
Seja C = c1n + c2nm + c3nmu
Se 2
2
E
tK = , então ],
)(ˆ)(ˆ)(ˆ[
mu
yV
m
yVyVKn ddC
CC ��� logo:
)]()(ˆ)(ˆ
)(ˆ[ 321 mucmccmu
yV
m
yVyVKC ddC
CC �����
])(ˆ)(ˆ
)(ˆ[1 22
mu
yV
m
yVyVt
nE ddC
CC ���
])(ˆ)(ˆ
)(ˆ[2
2
mu
yV
m
yVyV
E
tn ddC
CC���
])(ˆ)(ˆ
)(ˆ[)( 2
2
mu
yV
m
yVyV
yLE
tn ddC
CC ��
�
�
))(ˆ)(ˆ
)(ˆ(2
2
2
mu
yV
m
yVyV
yn
tLE ddC
CC ���
100])(ˆ)(ˆ
)(ˆ[1
)(% ����
mu
yV
m
yVyV
ny
tLE ddC
CC
])(ˆ)(ˆ)(ˆ
[)(ˆ 222
nmu
yV
nm
yV
n
yVtyVtE d dCCC
����
351
Amostragem por conglomerado
Obter Otim e Otiu que torne mínimo KCC =*
Para 0*
=∂m
C , implica:
Finalmente:
Como:
Então:
Para 0*
=∂u
C , implica:
)]()(ˆ)(ˆ
)(ˆ[ 321
* mucmccmu
yV
m
yVyVC ddC
CC �����
])(ˆ)(ˆ
)(ˆ[])(ˆ)(ˆ
)(ˆ[])(ˆ)(ˆ
)(ˆ[ 321
*
mu
yV
m
yVyVmuc
mu
yV
m
yVyVmc
mu
yV
m
yVyVcC ddC
C CddC
CCddC
CC ���������
)](ˆ)(ˆ)(ˆ[])(ˆ
)(ˆ)(ˆ[])(ˆ)(ˆ
)(ˆ[ 321
* yVyVuyVmucu
yVyVyVmc
mu
yV
m
yVyVcC ddCC C
dd
CCC
ddC
CC ���������
)(ˆ)(ˆ))(ˆ)(ˆ
( 32221
*
yVucyVcum
yV
m
yVc
m
CCCCC
ddC�����
�
))((ˆ])(ˆ
)(ˆ[322
1 uccyVu
yVyV
m
cCC
d d
C
oti
���
))((ˆ
])(ˆ
)(ˆ[
32
1
uccyV
u
yVyVc
mCC
dd
C
oti�
�
�
)](ˆ)(ˆ)(ˆ[])(ˆ
)(ˆ)(ˆ[])(ˆ)(ˆ
)([ 321
*yVyVuyVmuc
u
yVyVyVmc
mu
yV
m
yVyVcC ddCCC
dd
CCC
ddC
CC ���������
)]()(ˆ[])(ˆ
())(ˆ
[ 32221
*
yVyVmcu
yVc
mu
yVc
u
CCCC
dddd������
�
)](ˆ)(ˆ[)](ˆ)(ˆ[
132
1
2yVyVmcyVc
m
yVc
uCCCdd
dd
oti
���
)](ˆ)(ˆ[
))((ˆ
3
2
1
yVyVmc
cm
cyV
uCCC
dd
oti
�
�
�
352
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Tomando-se as diferenciais de segunda ordem em relação a m e u, verifica-se por meio da matriz Hessiana que otiu e otim tornam mínima a variância ).(yV ).
exercício 9.12
Seja uma área florestal de 648.000 ha. Esta área foi dividi-da em N = 120 unidades primárias (UP) de 5.400 ha cada, das quais foram sorteados n = 9 conglomerados de conglomerados. Em cada unidade primária sorteada foram alocados m = 5 conglo-merados. A estrutura espacial de cada conglomerado apresenta uma forma cruzada, composta por quatro subparcelas retangu-lares de 10 m de largura por 250 m de comprimento. A distância de cada subunidade ao ponto central foi de 50 m. A variável res-posta definida é o volume total de madeira considerando todas as espécies com DAP ≥ 30 cm. Os dados correspondentes às 180 subparcelas ou unidades terciárias de 0,25 ha foram trans-formados por hectare e estão apresentados na Tabela 9.28.
353
Amostragem por conglomerado
tabela 9.28 - Dados aplicativos: amostragem em três estágios.
CC C SUBPARCELAS TOTAIS1 2 3 4
1 1 183,0 141,5 153,8 162,8 641,11 2 186,3 78,3 134,8 164,8 564,21 3 188,4 200,6 157,4 137,0 683,41 4 234,5 184,4 183,3 206,9 809,11 5 167,9 189,1 177,7 238,1 772,8
TOTAIS 960,1 793,9 807,0 909,6 3470,62 1 198,3 167,0 172,2 137,1 674,62 2 112,5 69,9 98,3 126,1 406,82 3 170,3 181,4 352,1 230,8 934,62 4 257,2 379,7 198,0 132,4 967,32 5 116,8 67,5 67,9 106,8 359,0
TOTAIS 855,1 865,5 888,5 733,2 3342,33 1 255,2 226,8 229,1 304,2 1015,33 2 230,6 257,2 224,1 231,3 943,23 3 293,1 217,1 288,0 202,2 1000,43 4 155,6 143,4 222,8 195,1 716,93 5 229,1 417,5 237,3 227,9 1111,8
TOTAIS 1163,6 1262,0 1201,3 1160,7 4787,64 1 218,8 104,5 154,8 226,6 704,74 2 199,7 195,3 256,9 255,2 907,14 3 118,7 186,8 217,6 152,5 675,64 4 175,5 86,4 151,8 201,4 615,14 5 143,2 217,2 197,6 199,1 757,1
TOTAIS 855,9 790,2 978,7 1034,8 3659,65 1 208,0 186,2 160,9 305,5 860,65 2 244,1 183,9 205,9 232,0 865,95 3 195,6 329,3 230,2 194,4 949,55 4 205,9 225,4 230,0 221,9 883,25 5 184,6 207,6 201,8 195,9 789,9
TOTAIS 1038,2 1132,4 1028,8 1149,7 4349,16 1 275,5 133,3 190,1 200,6 799,56 2 236,0 257,6 234,5 275,0 1003,16 3 120,6 164,1 173,4 151,1 609,26 4 232,3 173,2 176,2 227,0 808,76 5 247,0 223,7 162,6 127,2 760,5
TOTAIS 1111,4 951,9 936,8 980,9 3981,07 1 139,6 147,5 78,8 111,5 477,47 2 172,2 177,8 136,9 201,4 688,37 3 138,5 88,6 46,4 55,3 328,87 4 164,6 149,5 165,5 144,6 624,27 5 62,9 81,8 118,8 97,1 360,6
TOTAIS 677,8 645,2 546,4 609,9 2479,308 1 132,8 167,9 173,8 167,6 642,18 2 170,3 171,8 138,8 126,9 607,88 3 151,6 225,1 165,1 174,0 715,88 4 165,7 188,4 87,5 167,0 608,68 5 173,6 166,5 190,0 221,3 751,4
TOTAIS 794,0 919,7 755,2 856,8 3325,709 1 177,4 233,6 274,4 228,7 914,19 2 203,4 286,5 253,8 214,9 958,69 3 210,6 311,8 256,1 140,3 918,89 4 87,9 243,6 142,7 197,0 671,29 5 234,1 259,3 158,4 170,8 822,6
TOTAIS 913,4 1334,8 1085,4 951,7 4285,30Total Geral 8369,50 8695,60 8228,10 8387,30 33680,50
354
Amostragem em inventário florestal Waldenei Travassos de Queiroz
a) informações preliminares sobre a área inventariada
Área florestal = 648.000 ha;área de cada de unidade primária é igual a:
haha
N
florestalÁrea400.5
120
000.648��
Número total de unidades primárias:
120400.5
000.648 ���haha
UPdaÁreaflorestalÁrea
N
N = número de unidades primárias sorteado é igual a 9, que será denominado de número de conglomerados de conglo-merados. Então:
120
91 ==
N
nf
Considerando que cada conglomerado apresenta uma for-ma cruzada cruz de malta, composto por quatro subunidades retangulares de 10 m de largura por 250 m de comprimento e uma distância de cada subunidade ao ponto central de 50 m, conclui-se que cada conglomerado ocupa um quadrado de 600m de lado, ou seja, uma área de 36 ha.
Número total de unidades secundárias:
m = 5 é o número de unidades secundárias amostrado e que será denominado de número de conglomerados. Então:
150
52 ==
M
mf
Número total de unidades terciárias:
15036
400.5 ���ha
ha
USdaÁrea
UPdaAréaM
14425,0
36 ���ha
ha
UTdaÁrea
USdaAréaU
355
Amostragem por conglomerado
u = 4 é o número de unidades terciárias amostrado e que será denominado de número de subparcelas do conglomerado. Então:
144
43 ==
U
uf
b) valor médio amostral considerando todas as unidades terciárias ou subparcelas
c) valores médios amostrais por unidade terciária (subpar-cela) dentro dos conglomerados (unidades secundárias) (Tabela 9.29)
tabela 9.29 - Médias estimadas por subparcela dentro dos conglomerados.
MÉDIAS ESTIMADAS ( uyyu
kijkij ∑
=
=1
)
CC (UP)ni ,,1 L=
CONGLOMERADOS ( mj ,,1 L= )
1 2 3 4 5
1 160,28 141,05 170,85 202,28 193,20
2 168,65 101,70 233,65 241,83 89,75
3 253,83 235,80 250,10 179,22 277,95
4 176,18 226,78 168,90 153,78 189,28
5 215,15 216,48 237,38 220,80 197,48
6 199,88 250,78 152,30 202,18 190,13
7 119,35 172,08 82,00 156,05 90,15
8 160,53 151,95 178,95 152,15 187,85
9 228,53 239,65 229,70 167,80 205,65
hamnmu
y
y
n
i
m
j
u
k
ijk
/1139,187459
5,33680 31 1 1�
����
���� � �
356
Amostragem em inventário florestal Waldenei Travassos de Queiroz
d) valores médios amostrais por unidade terciária (subpar-cela) dentro dos conglomerados de conglomerados (unidades primárias) (Tabela 9.30)
tabela 9.30 - Valores médios por unidade terciária dentro dos conglomerados de conglomerados.
CC 1 2 3 4 5
muyym
j
u
k
ijki ��� �
�1 1
173,53 167,12 239,38 182,98 217,46
6 7 8 9
199,05 123,97 166,29 214,27
e) valor total estimado
f) variância estimada por subparcela
1
)(
1
)(
)(ˆ 1 1
1 1 1
2
1
2
1 1 1
2
�
�
��
�
�
��� ��
�� ��� �
� � �
�� � �
nmu
nmu
y
y
nmu
yy
yV
n
i
m
j
n
i
m
j
u
k
ijku
k
ijk
n
i
m
j
u
k
ijk
1710,3628179
180
)5,680.33(95,531.951.6
)(ˆ
2
�
�
�yV
32,807.249.1211139,187000.648/ˆ mhayhaemÁreaY �����
357
Amostragem por conglomerado
g) variância estimada por meio da análise de variância do ensaio com classificação hierárquica
A partir dos resultados obtidos da análise de variância do ensaio com classificação hierárquica (Tabela 9.31) é calculado o valor da variância estimada do valor médio.
358
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 9.31 - Análise de variância: ensaios com classificação hierárquica.
Causas de Variação G.L. SQ QM F
Entre conglomerados deconglomerados
8 191.103,4875 23.887,9359 4,51
Entre conglomerados dentrodos conglomerados deconglomerados
36 190.499,6750 5.291,6576 2,67
Entre subunidades dentro deconglomerados dentro deconglomerados deconglomerados
135 267.839,45 1983,9959
Total 179 649.442,6153 3.628,1710
1
ˆ)1(ˆ)1(ˆ)1()(ˆ
...
�
�����
�
nm
MQunmMQmnMQnyV
CCdCdSubCCdCCC
1459
9959,1983)14(596576,5291)15(99359,887.23)19()(ˆ
���
����������yV
23)/(1710,628.3)(ˆ hamyV �
Componentes de variância:
h) desvio padrão estimado
hamyVyVyVysddCCC
/1615,617252,3740)(ˆ)(ˆ)(ˆ)( 3�����
359
Amostragem por conglomerado
i) coeficiente de variação estimado
j) variância da média de y (população infinita usando os
componentes de variância)
k) erro padrão estimado l) intervalo de confiança para a média populacional (Y )P )]()([ ystyYystyP ×+≤≤×− )] =1-a
Limite inferior para o valor médiohamysty /3999345,14117642684,1196,13057311,163)(
3������ 163,3057311 – 1,96 x 11,17642684 = 141,3999345 m3 / ha
Limite superior para o valor médio
m) intervalo de confiança para o valor total populacional (Y)Limite inferior para o valor total
Limite superior para o valor total
%69,321001139,187
1615,61100
)(%ˆ �����
y
ysVC
nmu
yV
nm
yV
n
yVyV
ddCCC )(ˆ)(ˆ)(ˆ)(ˆ
���
7107,132459
9959,1983
59
9154,826
9
8139,929)(ˆ �
��
�
�
��yV
hamyVys /17642684,11912517,124)(ˆ)(3���
hamysty /2115277,18517642684,1196,13057311,163)(3
������
96,1025,0;135);1( 2��
�tt unm �
hamhayLIhaemÁrea 000.648/56,157.627.913999345,141000.648)/(3
����
hamhayLShaemÁrea 000.648/070.017.1202115277,185000.648)/(3
����
360
Amostragem em inventário florestal Waldenei Travassos de Queiroz
n) limite de erro para inventário florestal
o) variância da média de y (população finita)
Se n conglomerados de conglomerados são selecionados ao acaso e se m conglomerados são também retirados alea-toriamente de dentro dos conglomerados de conglomerados selecionados e u subunidades também são selecionadas ale-atoriamente dentro dos conglomerados, tem-se que y é uma estimativa sem tendência de Y e sua variância é:
)(ˆ)1()(ˆ)1(
)(ˆ1)()(ˆ
3321
221
111 1 1 yV
nmu
fffyV
nm
ffyV
n
f
nmu
y
VyV
n
i
m
j
u
kijk −
+−
+−
==∑∑∑
= = =
Sendo:
)(ystE ��
hamE /9057966,2117642684,1196,13
���
LE %= %41397908,133057311,163
90579661,21100
)(���
�
y
yst
361
Amostragem por conglomerado
Dado que
;120
91 ==
N
nf
;
1505
2 ==M
mf
144
43 ==
U
uf :
p) dimensionamento da amostra considerando os conglo-merados de conglomerados
Suponha que o limite de erro estipulado seja de 10% (LE =
0,10). O resultado da análise mostrou que para nove conglome-rados de conglomerados o limite de erro foi de 13,41%. Então, deve-se calcular o número de conglomerados de conglomerados para atender ao limite de erro (LE) igual a 0,10 e, posteriormente, o número de conglomerados de conglomerados faltantes.
Dado que E = LE yLEE ×= , então E = 0,10 x 163,3057311 = 16,33057311
Considerando que são necessários 18 conglomerados de conglomerados para atender ao limite de erro de 10%, deve-se retornar à floresta e medir mais nove, visto que já foram medidos nove.
)(ˆ459
)144
41(
150
5
120
9
)(ˆ59
)150
51(
120
9
)(ˆ9
120
91
)(ˆ321 yVyVyVyV
��
��
�
�
�
�
�
�
)(ˆ459
)560024305555,0)(ˆ
59
0725,0)(ˆ
9
925,0)(ˆ
321 yVyVyVyV��
�
�
��
9959,1983459
)560024305555,02144,1322
59
0725,03387,1194
9
925,0)(ˆ
�
��
��
�
���yV
0268,01302,27515,122)(ˆ ���yV
)/(9085,124)(ˆ 3hamyV �
362
Amostragem em inventário florestal Waldenei Travassos de Queiroz
q) números de conglomerados e de subparcelas ideais
Supondo: C1 = R$12.000,00, C2 = R$1500,00 e C3 = R$250,00. Então:
C1 / C2 = 8 e C2 / C3 = 6
Considerando a população como infinita:
)4
6(8139,929
)4
9959,1.9839154,826(8
))((ˆ
])(ˆ
)(ˆ[
22
2
32
1
��
�
�
�
�
�
CC
C
uccyV
u
yVyVc
m
CC
dd
C
oti
61,21549,689833
3232,10.581
))((ˆ
])(ˆ
)(ˆ[
32
1
��
�
�
�
uccyV
u
yVyVc
m
CC
dd
C
oti
)9154,8268139,9295(6
)5
8(9959,1.983
)](ˆ)(ˆ[
))((ˆ
2
2
2
3
2
1
��
�
�
�
�
�
C
CC
yVyVmc
cm
cyV
u
CCC
dd
oti
38,2912,66415
5.158,38934
)](ˆ)(ˆ[
))((ˆ
3
2
1
��
�
�
�
yVyVmc
cm
cyV
uCC C
dd
o ti
Esses resultados recomendam que a estrutura ótima deva ter a unidade primária ou conglomerados de conglomerados composta por três conglomerados e cada conglomerado con-gregando três subparcelas.
cApítulo 10
InventárIo FlorestAl contínuo
Apresenta metodologias sobre a aplicação das técnicas de análise univariada com parcelas subdivididas (Split-Plot) e de amostragem com substituição parcial (Sampling with Partial Re-placement), em levantamentos com medidas repetidas no tempo visando avaliar o caráter dinâmico do crescimento de uma flo-resta. Mostra como analisar as tendências de crescimento pelo método dos polinômios ortogonais explicando a decomposição da soma de quadrados dos correspondentes efeitos polinomiais ortogonais em: efeito linear, quadrático, etc. Mostra exemplos aplicativos sobre todos os temas abordados.
365
Inventário florestal contínuo
Para avaliar o caráter dinâmico do crescimento de uma floresta, por exemplo, após uma intervenção exploratória dos recursos madeireiros, faz-se necessário proceder ao monitora-mento, o qual é definido como o instrumento de avaliação do processo de evolução e de recomposição das características qualitativas e quantitativas da floresta. Na ciência florestal, este procedimento é conhecido como Inventário Florestal Contínuo, que corresponde a efetuar medições repetidas vezes no tempo, ou seja, medições em várias ocasiões. Os sucessivos inventá-rios florestais permitirão definir os intervalos ideais de colheita dos produtos da floresta sob manejo sustentável.
Por outro lado, quando se procede às medições nas mes-mas unidades de amostra, sucessivamente, em várias ocasiões, evidentemente existirão correlações entre as ocasiões, as quais devem ser consideradas nas análises estatísticas.
De acordo com o tipo de alocação das unidades de amos-tra na população, a amostragem em múltiplas ocasiões pode ser classificada em três maneiras distintas:
a) amostras independentes (parcelas temporárias)
Neste caso, as amostras mensuradas nas diversas ocasi-ões são analisadas independentemente umas das outras, sendo as unidades das amostras medidas definidas como temporárias;
b) amostras dependentes (parcelas permanentes)
Constitui-se em um problema de população multivariada, onde as variáveis aleatórias, por exemplo, volume de madeira em p-ocasiões, seguem uma distribuição de probabilidade com vetor de médias ],,,[ 21
'pv YYYY L= e matriz de covariâncias ∑ . A matriz
366
Amostragem em inventário florestal Waldenei Travassos de Queiroz
de covariâncias é uma matriz simétrica que contém na diagonal principal as variâncias para cada uma das ocasiões e as covariân-cias das ocasiões combinadas aos pares fora da diagonal.
�����
�
�
�����
�
�
��
)()()(
)()()(
)()()(
21
22221
11211
yVyVyV
yVyVyV
yVyVyV
pppp
p
p
�����
��
O inventário florestal contínuo com parcelas permanentes, em termos da análise estatística, enquadra-se no grupo de expe-rimentos com medidas repetidas, mais precisamente na classe dos levantamentos longitudinais. Neste livro, considera-se que cada unidade de amostra recebe um único tratamento e sucessi-vamente no tempo mensuram-se as respostas correspondentes, tendo-se como objetivo o estudo de curvas de crescimento e análise de perfil.
Existem dois métodos com o propósito de testar as hipó-teses sobre o efeito dos tratamentos e a correspondente varia-ção ao longo do tempo. O primeiro adota um procedimento uni-variado, tratando as observações medidas no tempo como se fossem originadas de subdivisões das unidades experimentais (split-plot), sendo estudado através do delineamento em parce-las subdivididas ou divididas. O segundo método, denominado de análise de perfil “profile analysis”, adota um procedimento multivariado, ou seja, considera as observações repetidas sobre cada unidade experimental como um vetor de respostas.
A aplicação da análise univariada (método de parcelas sub-divididas), em experimentos de medidas repetidas no tempo, so-mente é válida sob a pressuposição de uniformidade da matriz de covariâncias. A matriz uniforme ocorre quando as ocasiões
367
Inventário florestal contínuo
apresentarem homogeneidade de variâncias e forem igualmente correlacionadas ( ρ ).
=∑
1
1
1
)(
L
LLLL
L
L
ρρ
ρρρρ
yV
)(yV é a variância comum entre as unidades dentro das ocasiões e ρ é a correlação comum entre as ocasiões combi-nadas aos pares.
O procedimento adotado é selecionar e medir a amostra na primeira ocasião, tornando as unidades de amostra perma-nentes, sendo remedidas nas ocasiões restantes. Neste proce-dimento, ocorrerão correlações entre as medições nas diversas ocasiões, e que em termos da ciência florestal são importantes para a interpretação do comportamento dos parâmetros envolvi-dos na recomposição da floresta;
c) amostras mistas
Neste caso a amostra do inventário contínuo consiste em estabelecer, conjuntamente, parcelas permanentes e temporá-rias. No item 10.2 será visto o procedimento com amostra mista denominado de Amostragem com Substituição Parcial (ASP), o qual apresenta uma grande importância na área de inventário florestal.
10.1 MÉTODO DE ANáLISE DE PARCELAS SUBDIVIDIDAS
Seja um experimento com o delineamento inteiramente ao acaso, em que m métodos silviculturais são aplicados em
368
Amostragem em inventário florestal Waldenei Travassos de Queiroz
n unidades experimentais, de modo que jn seja o número de parcelas submetidas ao j-ésimo tratamento ( mj ,,2,1 L= ) e as observações sejam feitas, periodicamente, em p ocasiões dis-tintas ( pk ,,2,1 L= ).
∑=
=m
jjnn
1
Seja ijkjkkjijk etooty ����� � o modelo matemático, onde ijky é a medida efetuada na i-ésima unidade de amostra de tamanho jn ( jni ,,2,1 L= ), submetida ao j-ésimo tratamento, e correspondente à k-ésima ocasião ( pk ,,2,1 L= ); jt é o efeito de tratamentos, ko é o efeito de ocasiões,
ijkjkkjijk etooty ����� � é o efeito de inte-ração entre tratamentos e ocasiões.
São considerados fixos os efeitos dos tratamentos, das oca-siões e da interação entre ocasiões e tratamentos e que a va-riável ijke seja normalmente distribuída. O modelo em parcelas subdivididas pressupõe que o desvio aleatório ijke é decomposto em duas fontes independentes de erros: )( jia e
)()( jikjkkjijijk btooaty ������ � , sendo )( jia o componente referente à diferença individual da i-ésima unidade dentro do j-ésimo tratamento e
)()( jikjkkjijijk btooaty ������ � o componente do erro refe-rente à medida efetuada sobre a unidade i submetida ao trata-mento j na ocasião k. Assim, o modelo apresenta a equação:
)()( jikjkkjijijk btooaty ������ �
Verifica-se que os tratamentos são aplicados sobre cada unidade experimental, enquanto que as ocasiões são considera-das como subdivisões dessas unidades. Nesse caso, os efeitos principais de tratamentos são calculados sobre os totais de uni-dades, e os efeitos da interação tratamentos × ocasiões a partir das diferenças entre observações dentro das unidades.
As somas de quadrados, pressupondo normalidade dos
369
Inventário florestal contínuo
erros, apresentam distribuição 2c e são mutuamente indepen-dentes.
A Tabela 10.1 apresenta a análise de variância usual para experimentos inteiramente ao acaso com tratamentos em parce-las subdivididas. A presença ou ausência de interação entre trata-mentos e ocasiões definirá o procedimento adequado para esta-belecer os testes de comparações múltiplas. O procedimento de ajustamento de curvas depende da ausência ou presença de inte-ração tratamento x ocasião. No caso da interação ser significativa, implica que os tratamentos se comportam de forma diferente em relação às ocasiões. Porém, se não existir interação significa que os tratamentos, no tempo, apresentam a mesma tendência.
Seja uma área florestal submetida a m tratamentos de manejo, onde foi realizado um inventário florestal contínuo com uma amostragem simples ao acaso de n unidades de amostra considerando p ocasiões distintas, tal que .21 mnnnn +++= L
tabela 10.1 - Análise de variância: delineamento inteiramente ao acaso de parcelas divididas.
C. variação G.L. S.Q. Q.M.
Tratamentos(Trat) 1�m �
�
��m
j
j
jnp
yy
npSQ
1
2
...2
..1
11
1
11
��
m
SQQM
Erro (a) mn � � ��� ��
��m
j
m
j
j
j
n
i
ij Ynp
yp
SQj
1 1
2
..
1
2
.2
111
mn
SQQM
�� 2
2
Ocasiões(Oca)
1�p ��
��
p
k
knp
yy
nSQ
1
2
...2
..3
113
3�
�p
SQQM
Trat � Oca )1)(1( �� mp 31
1 1
2
...2
.4
1SQSQ
np
yy
nSQ
m
j
p
k
jk
j
���� ��� �
)1)(1(
44
���
mp
SQQM
Erro(b) ))(1( mnp ��432165
SQSQSQSQSQSQ �����))(1(
55
mnp
SQQM
���
Total 1�np ���� � �
��j
n
i
m
j
p
k
ijknp
yySQ
1 1 1
2
...2
6
370
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Normalmente, em experimentos com parcelas divididas, o interesse é testar as seguintes hipóteses:
H01: Não existência de efeito diferencial de tratamentosH01: tj = 0 (j = l, • • • , m)
2
1
1
QM
QMF �
H02: Não existência de efeito diferencial de ocasiõesH02: ok = 0 (k = l, • • • , p)
5
3
2QM
QMF �
H03: Não existência de efeito de interação entre tratamen-tos e ocasiões
H03: tojk = 0 [( j = l, • • • , m); (k = 1, • • • , p)]
5
4
3QM
QMF �
Se H03 denota que o efeito da interação é não significativo, resulta que todos os tratamentos apresentam a mesma tendên-cia de crescimento. No entanto, se o efeito da interação é signifi-cativo verifica-se que pelo menos um tratamento apresenta uma tendência diferente.
A natureza da tendência é estudada através de curvas apropriadas. Tratar-se-á, no exemplo a seguir, do ajustamento de curvas polinomiais.
371
Inventário florestal contínuo
exercício 10.1
Seja o ensaio instalado em 1980 por Yared (1983), na Esta-ção Experimental do Centro de Pesquisas Agroflorestal da Ama-zônia Oriental - CPATU, da Empresa Brasileira de Pesquisas Agropecuária - EMBRAPA, no município de Belterra, estado do Pará, e apresentado em Queiroz (1993b). Os dados da Tabe-la 10.2 referem-se aos incrementos em altura (metros) de qua-tro procedências de Cordia alliodora: (9/77: Honduras), (10/77: Guatemala), (20/77: San Francisco – Honduras) e (19/77: Finca-la Fortuna – Honduras). No ensaio foi usado o delineamento em blocos ao acaso com 5 repetições e mensurado aos 6, 12, 18, 24 e 30 meses. A Tabela 10.3 apresenta a estrutura da análise de variância de parcelas divididas em blocos ao acaso. A Tabela 10.4 mostra os valores totais das combinações Proc × Oca.
372
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 10.2 - Incrementos em altura (metros) das quatro procedências (Proc).
Proc. Meses(Oca)
BlocosMédia
I II III IV V Total
9/77 612182430
0,590,510,240,540,35
0,370,490,780,690,44
0,520,420,450,310,18
0,520,370,410,500,11
0,440,400,310,360,21
2,442,192,192,401,29
0,490,440,440,480,26
Total - 2,23 2,77 1,88 1,91 1,72 10,51 -
10/77 612182430
0,680,740,650,380,48
0,550,360,510,390,20
0,590,460,630,310,06
0,580,420,310,240,21
0,600,430,520,400,19
3,002,412,621,721,14
0,600,480,520,340,23
Total - 2,93 2,01 2,05 1,76 2,14 10,89 -
20/77 612182430
0,630,901,110,960,60
0,581,051,140,850,40
0,690,871,121,020,59
0,500,710,980,650,62
0,490,781,040,910,40
2,894,315,394,392,61
0,580,861,000,880,52
Total - 4,20 4,02 4,29 3,46 3,62 19,59 -
19/77 612182430
0,650,790,790,790,61
0,580,690,870,770,51
0,440,770,730,690,25
0,540,810,720,350,41
0,260,230,540,530,49
2,473,293,653,132,27
0,490,660,730,630,45
Total - 3,63 3,42 2,88 2,83 2,05 14,81 -
Total geral
- 12,88 12,22 11,10 9,96 9,53 55,80 -
373
Inventário florestal contínuo
tabela 10.3 - A análise de variância de parcelas divididas em blocos ao aca-so.
Variação G.L. S.Q. Q.M.
Blocos r - 1
rmp
y
mp
y
SQ
r
ii
Blo
2
...1
2
..
cos��
�� 1
co s
cos
�
�
r
SQQM Blo
Blo
Procedências m - 1
rmp
y
rp
y
SQ
m
j
j
oc
2
...1
2
..
Pr��
�� 1
Pr
Pr
�
�
m
SQQM
oc
oc
Erro (a) (r - 1)(m - 1)
ocBlo
r
i
m
j
i j
aErro
SQSQ
rmp
y
p
y
SQ
Prcos
2...1 1
2.
)(
��
��
��� � )1)(1(
)(
)(��
�
mr
SQQM
aErro
aErro
Ocasiões p - 1
rmp
y
rm
y
SQ
p
kk
Oca
2
...1
2
..
��
�� 1�
�
p
SQQM
Oca
Oca
Proc×Oca (m - 1)(p - 1)
Ocaoc
m
j
p
kjk
Ocaoc
SQSQ
rmp
y
r
y
SQ
��
��
��� �
�
Pr
2
...1 1
2
.
Pr
Proc
Proc
Erro (b) m(r - 1)(p - 1)Ocao cOcaaErro
ocBloTotalbErro
SQSQSQ
SQSQSQSQ
����
���
Pr)(
Prco s)(
)1(1(
)(
)(��
�
prm
SQQM
bErro
bErro
Total rmp - 1�� �
� � �
��jn
i
m
j
p
kijkTotal
rmp
yySQ
1 1 1
2
...2
374
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 10.4 - Valores totais das combinações: Proc × Oca.
Ocasiões(meses)
Procedências Total
9/77 10/77 20/77 19/77
612182430
2,442,192,192,401,29
3,002,412,621,721,14
2,894,315,394,392,61
2,473,293,653,132,27
10,8012,2013,8511,64 7,31
Total 10,51 10,89 19,59 14,81 55,80
;4=m ;5=r 5=p
a) análise de variância preliminar
���� � �
��r
i
m
j
p
k
ij k yy1 1 1
...80,55
7378,361 1 1
2����
� � �
r
i
m
j
p
k
ijky
1364,31554
80,5522
... ���
��rmp
yC
��
������r
i
iy1
222222
..3010,63153,996,910,1122,1299,12
��
�����m
j
jy1
22222
..1564,83281,1459,1989,1051,10
951,16905,283,277,223,22222
1 1
2
.��������
� �
�m
j
r
i
ijy
2282,64631,764,1185,132,128,1022222
1
2
..�������
�
p
k
ky
162,17627,213,319,244,2 2222
1 1
2
.��������
� �
�m
j
p
k
jky
375
Inventário florestal contínuo
Portanto:
6014,51364,317378,361 1 1
2����� ���
� � �
r
i
m
j
p
k
ijkTotal CySQ
42865,01364,313010,63154
11
1
2
..cos ����
��� ��
r
i
iBlo Cymp
SQ
149856,21364,311564,83255
11
1
2
..Pr ����
��� ��
m
j
joc Cyrp
SQ
149856,242865,01364,315
951,1691
1
Prcos
1
2
.)(�������� ��
� �
n
i
ocBlo
m
j
ijaErroSQSQCy
pSQ
275294,0)( �aErroSQ
17501,11364,312282,64645
11
1
2
..���
���� �
�
Cyrm
SQp
k
kOca
17501,1149856,21364,31162,1765
11
1
Pr
1
2
.Pr��������� ��
� �
�
m
j
Ocaoc
p
k
jkOcaocSQSQCY
rSQ
771134,0Pr ��OcaocSQ
OcaocOcaaErroocbloTotalbErro SQSQSQSQSQSQSQ ������� Pr)(Prcos)(
771134,017501,1275294,0149856,242865,06014,5)( ������bErroSQ
801456,0)( �bErroSQ
Na Tabela 10.5 estão apresentados os resultados da análi-se de variância preliminar.
tabela 10.5 - Resultados da análise de variância preliminar.
Causas de variação GL SQ QM F
BlocosProcedênciasResíduo (a)Ocasiões
Procedência x OcasiãoResíduo (b)
43
124
1264
0,42872,14990,27531,17500,77110,8015
0,10720,71660,02290,29370,06430,0125
31,29 **
23,50 ** 5,14 **
Total 99 5,6015 - -
;95,501,0;12;3
�F ;65,301,0;64;4
�F 50,201,0;64;12
�F
376
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Se o efeito da interação fosse não significativo, então as procedências apresentariam a mesma tendência de crescimen-to em relação às ocasiões. No entanto, a análise de variância mostra que a interação procedência x ocasião é altamente sig-nificativa, o que demonstra que as procedências se comportam de maneira diferente em relação às ocasiões. Neste caso, se analisa as tendências através do ajustamento de curvas poli-nomiais às médias ou totais de observações para cada ocasião sobre cada procedência. O grau do polinômio para cada proce-dência é obtido pela decomposição da soma de quadrados dos correspondentes efeitos polinomiais ortogonais em: efeito linear, quadrático, etc., até o grau .1−p
Analisando-se as tendências através de curvas polino-miais, deve-se desdobrar a variação de ocasiões e a interação procedência x ocasião, nos componentes: ocasiões dentro da procedência 9/77, ocasiões dentro da procedência 10/77, oca-siões dentro da procedência 20/77, ocasiões dentro da proce-dência 19/77, onde cada componente terá 4 graus de liberdade, sendo então desdobrados nos efeitos: linear, quadrático, cúbico e quarto grau. Neste exemplo, de acordo com Gomes (2000), como se têm cinco ocasiões igualmente espaçadas, os coefi-cientes dos polinômios ortogonais são os mostrados na Tabela 10.6. A Tabela 7 do Anexo apresenta os coeficientes para inter-polação de polinômios ortogonais até onze ocasiões.
377
Inventário florestal contínuo
tabela 10.6 - Coeficientes dos polinômios ortogonais.
Ocasiões (p = 5)Total Tratamento
1° Grau (c1) 2° Grau (c2) 3° Grau (c3) 4° Grau (c4)
-2-10
+1+2
+2-1-2-1
+2
-1+20-2
+1
+1-4
+6-4
+1
10,8012,2013,8511,64 7,31
Da teoria dos polinômios ortogonais, têm-se as seguintes fór-
mulas para calcular a soma de quadrados para cada componente:
;
)(
1
2
1
rK
TC
SQ
p
i
i1i
Linear
��� ;
)(
2
1
2
rK
TC
SQ
p
i
i2i
Quadrático
��
�
;
)(
3
1
2
rK
TC
SQ
p
i
i3i
Cúbico
���
4
1
2
4
)(
0
rK
TC
SQ
p
i
i4i
grau
���
C1, C
2, C
3, C
4 representam os coeficientes dos polinômios
ortogonais;iT = reporta os totais dos tratamentos nas p ocasiões;
K1, K
2, K
3, K
4 são as somas de quadrados dos coeficientes
dos polinômios ortogonais.
b) análise de variância final
Para estudar o comportamento das ocasiões dentro de cada procedência é necessário desdobrar interação Proc x Oca.
De acordo com a Tabela 10.4, tem-se:
1) 175576,055
51,10
5
)29,140,219,219,244,2(77/9...
222222
�
�
�����
�dOcaSQ
378
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Desdobrando SQ . Oca.d.9/77 nos efeitos: linear, quadrático, cúbico e quarto grau:
O termo SQ . Oca.d.9/77 significa soma de quadrados do fator ocasião dentro do tratamento 9/77.
Note que:
00004321
77/9... SQSQSQSQdOcaSQ ����
570063431428,0049298,0032572857,0087362,000004321
������� SQSQSQSQ
175575999,00000 4321���� SQSQSQSQ
379
Inventário florestal contínuo
2) 442416,055
89,10
5
)14,172,162,241,200,3(77/10...
222222
�
�
�����
�dOcaSQ
Desdobrando SQ . Oca.d.10/77 nos efeitos: linear, quadráti-co, cúbico e quarto grau:
Note que:
00004321
77/10. SQSQSQSQdOcaSQ ����
031873142,0004608,0016972857,0388962,00000 4321
������� SQSQSQSQ
442415999,077/10... �dOcaSQ
380
Amostragem em inventário florestal Waldenei Travassos de Queiroz
3) 062176,155
59,19
5
)61,239,439,531,489,2(77/20...
222222
�
�
�����
�dOcaSQ
Desdobrando SQ . Oca.d.20/77 nos efeitos: linear, quadráti-co, cúbico e quarto grau:
Note que:
00004321
77/20... SQSQSQSQdOcaSQ ����
026404571,0003872,0027291429,1004608,000004321
������� SQSQSQSQ
062176,177/20... 00004321
����� SQSQSQSQdOcaSQ
381
Inventário florestal contínuo
4)
Desdobrando SQ . Oca.d.19/77 nos efeitos: linear, quadráti-co, cúbico e quarto grau:
Note que:
00004321
77/19... SQSQSQSQdOcaSQ ����
570026331428,0000288,0256822857,0006272,000004321
������� SQSQSQSQ
266015999,000004321
���� SQSQSQSQ
382
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Observando que:SQ . Oca d.9 / 77 + SQ . Oca . d 10 / 77 + SQ . Oca . d . 20 / 77 + SQ . Oca . d . 19 / 77 = SQOca + SQProc x Oca Oc aocOca
SQSQdOcaSQdOcaSQdOcaSQdOcaSQ�
�����Pr
77/19...77/20...77/10..77/9..
9461,1266016,0062176,1442416,0175576,0
77/19...77/20...77/10..77/9..
����
���� dOcaSQdOcaSQdOcaSQdOcaSQ
Sendo:SQOca + SQProc x Oca = 1,1750 + 0,7711 = 1,9461
A Tabela 10.7 apresenta o resultado da análise de variân-cia final.
tabela 10.7 - Análise de variância final.
Causas de variação GL SQ QM FBlocosProcedênciasResíduo (a)
43
12
0,42862,14000,2754
0,10710,71660,0229
- 31,29 **
-
Ocasiões d. Procedências (16) (1,9462) - -
Ocasiões d. Procedência 9/77Efeito linearEfeito quadráticoEfeito cúbicoEfeito de 40 grau
(4)1111
(0,1756)0,08740,03260,04930,0063
0,04390,08740,03260,04930,0063
-
- 6,99 *
2,613,940,50
Ocasiões d. Procedência 10/77Efeito linearEfeito quadráticoEfeito cúbicoEfeito de 40 grau
(4)1111
(0,4424)0,38900,01700,00460,0319
0,11060,38900,01700,00460,0319
8,85 31,12 **
1,36 0,37 2,55
Ocasiões d. Procedência 20/77Efeito linearEfeito quadráticoEfeito cúbicoEfeito de 40 grau
(4)1111
(1,0622)0,00461,02730,00390,0264
0,26550,00461,02730,00390,0264
21,240,37
82,18 **0,312,11
Ocasiões d. Procedência 19/77Efeito linearEfeito quadráticoEfeito cúbicoEfeito de 40 grau
(4)1111
(0,2660)0,00630,25680,00030,0026
0,06650,00630,25680,00030,0026
5,320,50
20,64 **0,020,21
Resíduo (b) 64 0,8014 0,0125 -Total 99 5,6014 - -
* significativo ao nível de 95% de confiança** significativo ao nível de 99% de confiança
383
Inventário florestal contínuo
Os resultados da análise de variância mostrados na Ta-bela 10.7, demonstram que as procedências 9/77 e 10/77 possuem tendências lineares de crescimento do incremento
)(iii
ebXaY ��� ; enquanto as tendências de crescimento do incremento das procedências 20/77 e 19/77 são descritas pelo modelo quadrático
iiecXbXaY ����
2 . A Figura 10.1 confirma esses resultados.
0
1
2
3
4
5
6
6 12 18 24 30
OCASIÕES (meses)
INC
RE
ME
NTO
EM
ALT
UR
A(m
)
T9/77
T10/77
T20/77
T19/77
Figura 10.1 - Tendências do crescimento do incremento em altura.
A Tabela 10.8 mostra as comparações dos valores médios dentro de cada ocasião, para as procedências que apresenta-ram as mesmas tendências, através do teste de “t” de Student, para tratamentos independentes (procedências).
384
Amostragem em inventário florestal Waldenei Travassos de Queiroz
tabela 10.8 - Comparação dos incrementos dentro de cada ocasião (Teste “t”).
Ocasiões Procedência 9/77 Procedência 10/77 Valor “t”
Médias Variâncias Médias Variâncias
612182430
0,48800,43800,43800,48000,2580
0,007170,003570,04340,02290,0180
0,60000,48200,52400,34400,2280
0,002350,022100,018300,004630,02360
-2,5668 *-0,6141 ns-0,7742 ns 1,8328 ns
Ocasiões Procedência 20/77 Procedência 19/77 Valor “t”
Médias Variâncias Médias Variâncias
612182430
0,57800,86201,07800,87800,5220
0,007270,016700,004420,020200,01250
0,49400,65800,73000,62600,4540
0,02290,05930,01490,03430,0181
1,0814 ns1,6547 ns5,5984 **2,4137 *0,8692 ns
3060,205,0;8 �t
3554,301,0;8 �t
Os resultados mostram diferença somente na primeira oca-sião (6 meses) entre os incrementos das procedências 9/77 e 10/77, concluindo-se pela não existência de coincidência nos perfis de crescimento.
Denota-se diferença entre as procedências 20/77 e 19/77 nas ocasiões 18 meses e 24 meses, concluindo-se pela não existência de coincidência nos perfis de crescimento.
10.2 MODELO DE AMOSTRAGEM COM SUBSTITUIçãO PAR-CIAL
A Amostragem com Substituição Parcial – ASP (“Sampling with Partial Replacement”) reporta-se ao problema da amostra-gem de uma população multidimensional. Para melhor enten-dimento, seja o caso de uma população bivariada, tal que as
385
Inventário florestal contínuo
variáveis aleatórias x e y possuem distribuição de probabilidade com vetor de médias vY desconhecido e matriz de covariâncias � conhecida.
Visando apresentar o desenvolvimento teórico da ASP, sejam três subamostras aleatórias com as dimensões k, m e n e estatisticamente independentes. O método consiste na me-dição da característica x, que representa o volume de madeira na primeira ocasião, somente nas unidades da subamostra de tamanho k. Na subamostra de tamanho m são medidas as ca-racterísticas x e y, sendo y o volume de madeira na segunda ocasião. Nas unidades da subamostra de dimensão n somente a característica y é medida.
Verifica-se que a subamostra de tamanho n, na verdade, pode ser interpretada como substitutiva da subamostra k e, por essa razão, essas subamostras são interpretadas como uma Amostra-gem com Substituição Parcial (ASP). Obviamente, o procedimento pode evoluir para três ou mais ocasiões. Informações mais deta-lhadas sobre a amostragem com substituição parcial podem ser encontradas em Cunia (1974) e em Cunia e Chevrou (1969).
10.2.1 estimador Asp de xµ e sua variância )ˆ( xV µ
Seja um levantamento florestal contínuo onde se deseja esti-mar os volumes médios de madeira em uma determinada ocasião ( x ) e em outra ocasião subsequente ( y ), bem como estimar o incremento médio em volume entre essas duas ocasiões ( xy − ).
Sejam as observações concernentes às subamostras de dimensões k, m e n, selecionadas inteiramente ao acaso e men-suradas para as características x e y, conforme o critério ASP.
nmkmkmkmkkkmkkkk yyyyyyxxxxxx ++++++++++++ ,...,,,,...,,,,...,,,,...,, 21212121
386
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Seja xµ a forma geral do estimador linear e não tendencio-so da média aritmética :xµ
nmknmkmkmk
mkmkkkmkmkkkkkx
ycyc
ycycxaxaxaxa
++++++++
++++++++
+++++++++++=
L
LLL
11
111111µ
Sob o argumento de que x e y estão na mesma amostra e caracterizados pelo mesmo tratamento, pode-se formular ,ˆ xµ como:
nnmmmmkkx ycycxaxa +++=µ (10.1)
Por conseguinte:)()()()()ˆ( nnmmmmkkx yEcyEcxEaxEaE +++=µ
ynymkmkkx ccaaE µµµµµ +++=)ˆ(
ynmxmkx ccaaE µµµ )()()ˆ( +++=
Para que ,)ˆ( xxE µµ = então mk aa −= 1 e nm cc −= , tal que efetuando as substituições na Equação 10.1, obtém-se:
)()(ˆ mnnmkmkx yycxxax −+−−=µ (10.2)
Dado que k
xVxV k
)()( = e
m
xVxV m
)()( = , então:
m
xV
k
xVxxV mk
)()()( +=−
Pois os estimadores kx e mx são estatisticamente inde-pendentes.
Dado que ny e my são estatisticamente independentes, tem-se:
m
yV
n
yVyyV mn
)()()( +=−
387
Inventário florestal contínuo
Pois:;
)(),cov(
k
xVxxx mkk =− ;0),cov( =− mnk yyx
m
yxVyyxx mnmk
),(),cov( =−− .
Então a variância de xµ é dada pela expressão:
m
yxVca
k
xVa
nmyVc
mkxVa
k
xVV
nmmnmx
),(2
)(2)
11)(()
11)((
)()ˆ(
22��������
m
yxVca
k
xVa
nmyVc
mkxVa
k
xVV
nmmnmx
),(2
)(2)
11)(()
11)((
)()ˆ(
22��������
m
yxVca
k
xVa
nmyVc
mkxVa
k
xVV
nmmnmx
),(2
)(2)
11)(()
11)((
)()ˆ(
22��������
m
yxVca
k
xVa
nmyVc
mkxVa
k
xVV
nmmnmx
),(2
)(2)
11)(()
11)((
)()ˆ(
22�������� (10.3)
Diferenciando-se a Expressão 10.3 em relação aos coefi-cientes ma e nc e anulando as derivadas parciais, obtém-se o ponto crítico dado em 10.4 e 10.5.
0)]11
)((2),(
2[])(
2),(
2)11
)((2[)ˆ( ���������nnmmnmx
dcnm
yVcm
yxVada
k
xV
m
yxVc
mkxVadV �
Logo:
���
���
�
����
����
0)11
)((2),(
2
0)(
2),(
2)11
)((2
nmyVc
m
yxVa
k
xV
m
yxVc
mkxVa
nm
nm
���
���
�
����
����
0)11
)((2),(
2
0)(
2),(
2)11
)((2
nmyVc
m
yxVa
k
xV
m
yxVc
mkxVa
nm
nm
���
���
�
����
����
0)11
)((2),(
2
0)(
2),(
2)11
)((2
nmyVc
m
yxVa
k
xV
m
yxVc
mkxVa
nm
nm
���
���
�
����
����
0)11
)((2),(
2
0)(
2),(
2)11
)((2
nmyVc
m
yxVa
k
xV
m
yxVc
mkxVa
nm
nm
Concluindo que:
2))((
)(
�knnmmk
nmma
m���
�� (10.4)
2))(( �knnmmk
mnBc
x y
n���
� (10.5)
Dado que:
;)(
),(
yV
yxVBxy � ;
)(
),(
xV
yxVByx � yxxy BB�
2�
388
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Para verificar a natureza do ponto crítico pela matriz Hes-siana, seja a diferencial de segunda ordem de )ˆ( xV µ :
Escrevendo na forma matricial, resulta:
A expressão )ˆ(2xVd µ é uma função homogênea do tipo
Q(xv) = xvAx ,)( 'vvv AxxxQ = , tal que n
nv Rxxxx ∈= ),...,,( 21' e A = (aij) nnijaA ×= )( é uma
matriz real. A função )( vxQ é denominada forma quadrática e A é chamada de matriz da forma quadrática e denominada de ma-triz Hessiana, a qual possui seus elementos calculados no ponto crítico.
Uma forma quadrática é dita positiva definida somente se 0)( >vxQ , tal que n
v Rx ∈∀ e vvv xxQ 00)( =⇔= . Esta mesma definição vale para a matriz da forma quadrática A , devido à correspondência biunívoca entre a forma quadrática e a matriz da forma quadrática.
O próximo passo é verificar se a matriz Hessiana é positiva definida, e, assim, comprovar que ma e nc , obtidos, respectiva-mente, pelas Equações 10.4 e 10.5, tornam mínima ),ˆ( xV µ ).
m
yxVca
k
xVa
nmyVc
mkxVa
k
xVV nmmnmx
),(2
)(2)
11)(()
11)((
)()ˆ( 22
��������m
yxVca
k
xVa
nmyVc
mkxVa
k
xVV nmmnmx
),(2
)(2)
11)(()
11)((
)()ˆ( 22
��������m
yxVca
k
xVa
nmyVc
mkxVa
k
xVV nmmnmx
),(2
)(2)
11)(()
11)((
)()ˆ( 22
��������m
yxVca
k
xVa
nmyVc
mkxVa
k
xVV nmmnmx
),(2
)(2)
11)(()
11)((
)()ˆ( 22
��������
389
Inventário florestal contínuo
Seja H a matriz Hesssiana:
���
�
�
���
�
�
��
���
)11
)((2),(
2
),(2)
11)((2
nmyV
m
yxVm
yxV
mkxV
H
���
�
�
���
�
�
��
���
)11
)((2),(
2
),(2)
11)((2
nmyV
m
yxVm
yxV
mkxV
H
���
�
�
���
�
�
��
���
)11
)((2),(
2
),(2)
11)((2
nmyV
m
yxVm
yxV
mkxV
H
���
�
�
���
�
�
��
���
)11
)((2),(
2
),(2)
11)((2
nmyV
m
yxVm
yxV
mkxV
H
De acordo com Searle (1971) e Ware e Cunia (1962), den-tre outros autores, para que uma matriz 22× seja definida posi-tiva, o determinante e os elementos da diagonal principal devem ser positivos. Neste caso, resulta:
0)11
)((2 ��
mkxV e 0)
11)((2 ��
nmyV0)
11)((2 ��
mkxV e 0)
11)((2 ��
nmyV0)
11)((2 ��
mkxV e 0)
11)((2 ��
nmyV0)
11)((2 ��
mkxV e 0)
11)((2 ��
nmyV , faltando verificar se
[ ]Hdet é positivo.
Multiplicando pela quantidade sempre positiva ,)]()(4[)(
2 yVxVnkm o sinal do [ ]Hdet não se altera:
� � 0det])()(4
[ 22
2
������ �knknkmmnmHyVxV
nkm
Como [ ] 0det >H , conclui-se que a matriz Hessiana é defi-nida positiva, logo, )ˆ( xV µ é mínima para os coeficientes ma e nc dados em 10.4 e 10.5.
Finalmente, substituindo ma e nc na equação de ),ˆ( xV µ ). Tem-se:
]))((
1[)(
)ˆ(2
2
�
��
knnmmk
mn
mk
xVV
x
����
��
10.2.2 estimador Asp de yµ e sua variância )ˆ( yV µ
O estimador ASP pode ser deduzido diretamente da fórmu-
390
Amostragem em inventário florestal Waldenei Travassos de Queiroz
la correspondente ao estimador xµ , pois o modelo matemático é simétrico com respeito às variáveis x e y, resultando:
)()(ˆ ''
mnnmkmy yycxxay ������
Utilizando os mesmos procedimentos usados para obter xµ , têm-se:
2
'
))(( �knnmmk
kmBa
y x
m���
��
2
'
))((
)(
�knnmmk
mkmcn
���
���
]))((
1[)(
)ˆ(2
2
�
��
knnmmk
km
nm
yVV y
����
��
10.2.3 covariância entre os estimadores Asp xµ e yµ
Dado:
)()(ˆ mnnmkmkx yycxxax −+−−=µ
)()(ˆ ''mnnmkmny yycxxay −+−−=µ
Então, pela definição de covariância:
)]}ˆ(ˆ)][ˆ(ˆ{[)ˆ,ˆ( yyxxyx EEECov ������ ���
Desenvolvendo, resulta que:
2))((
),()ˆ,ˆ(
���
knnmmk
yxmVCov yx
����
391
Inventário florestal contínuo
10.2.4 estimador Asp de dµ e sua variância )ˆ( dV µ
Dado que:
mk
xmxk
mk
xx mk
mk
ii
mk ++
=+
=∑
+
=+
1
nm
ynym
nm
yy nm
nmk
kii
nm ++
=+
=∑
++
+=+
1
Como xnk xExExE µ=== )()()( e :)()()( ynm yEyEyE µ===
mk
xmxk
nm
ynymxyd mknm
mknm ++
−++
=−= ++
Resultando:
))((
),(2)()()(
nmmk
yxmV
nm
yV
mk
xVdV
��
�
�
�
�
�
Shiver e Border (1996), utilizando as definições e os ar-gumentos apresentados anteriormente para obter xµ e yµ , de-monstram que:
kdmdndmdd xbxbyaya )1()1(ˆ �������
2))((
)(
�knnmmk
mnBmkma
xy
d���
���
2))((
)(
�knnmmk
kmBnmmb
yx
d���
����
m
yxVba
k
xVb
m
xVb
n
yVa
m
yVaV ddddddd
),(2
)()1(
)()()1(
)()ˆ(
222��������
392
Amostragem em inventário florestal Waldenei Travassos de Queiroz
exercício 10.2
Seja o exemplo citado em Queiroz (1983) de um inventário florestal realizado em duas ocasiões, através da amostragem com substituição parcial, tal que a medição da primeira ocasião ocor-reu em k + m = 40 unidades de amostra (Ua), enquanto a medição da segunda ocasião ocorreu em m + n = 30 unidades de amostra, sendo m = 20 o número de parcelas permanentes medidas nas duas ocasiões. A Tabela 10.9 apresenta os valores volumétricos. Neste exemplo, utilizar o valor t = 2,00 (Estatística “t” de Student).
tabela 10.9 - Volume (m3/ ha).
Ua x y UA x y
12345678910111213141516171819202122232425
5,6616,26 12,40 7,56 11,88 11,48 9,86 12,74 9,1812,14 9,64 11,08 7,6816,00 5,74 2,5211,04 8,90 9,1817,8810,0610,8210,56 7,48 8,94
- - - - - - - - - - - - - - - - - -- -
15,5515,9115,8114,4214,99
26272829303132333435363738394041424344454647484950
6,049,30
18,2012,4211,3813,929,40
15,668,20
10,3012,0412,0813,708,908,72
- - - - - - - - - -
13,8515,0719,7316,6416,1017,1615,2319,0514,8215,6816,8216,4417,3015,1115,2414,4515,6015,5018,5413,3215,5018,4115,5214,2616,50
Fonte: Queiroz (1983)
393
Inventário florestal contínuo
a) estimativas das médias e das variâncias não conside-rando a ASP
a1) estimativas para a primeira ocasião da subamostra de tamanho k
hamk
x
x
k
i
i
k/441,10
20
82,208 31 ���
��
23
2
2
1
1
2
)/(009788,1419
20
82,2084756,2446
1
)(
)(ˆ hamk
k
x
x
xV
k
i
ik
i
i
k�
�
��
�
�
��
�
�
23 )/(7004894,020
009788,14)(ˆ)(ˆ ham
k
xVxV
k
k���
a2) estimativas para a primeira ocasião da subamostra de tamanho m
hamm
x
x
mk
ki
i
m/906,10
20
12,218 31���
��
��
23
2
1
2
12
)/(3861937,819
20
12,2181544,2538
1
)(
)(ˆ hamm
m
x
x
xV
mk
ki
mk
ki
i
i
m�
�
��
�
�
���
��
�
��
)/(4193096,020
3861937,8)(ˆ)(ˆ 3
hamm
xVxV
m
m���
2
a3) estimativas para a primeira ocasião da amostra de ta-manho mk +
hammk
x
x
mk
i
i
mk/6735,10
40
94,426 31��
��
��
�
�
23
2
1
2
12
)/(966305,1039
40
94,4266300,4984
1
)(
)(ˆ hammk
mk
x
x
xV
mk
i
mk
i
i
i
mk�
�
���
��
�
���
�
�
�
�
23)/(2741576,0
40
9663,10)(ˆ)(ˆ ham
mk
xVxV
mk
mk��
��
�
�
hamxVxsmkmk
/523601,02741576,0)(ˆ)( 3�����
394
Amostragem em inventário florestal Waldenei Travassos de Queirozham
mk
x
x
mk
i
i
mk/6735,10
40
94,426 31��
��
��
�
�
23
2
1
2
12
)/(966305,1039
40
94,4266300,4984
1
)(
)(ˆ hammk
mk
x
x
xV
mk
i
mk
i
i
i
mk�
�
���
��
�
���
�
�
�
�
23)/(2741576,0
40
9663,10)(ˆ)(ˆ ham
mk
xVxV
mk
mk��
��
�
�
hamxVxsmkmk
/523601,02741576,0)(ˆ)( 3�����
a4) limite de erro para a estimativa mkx + (primeira ocasião)
%81,91006735,10
523601,02100
)()( ��
���
��
�
�
�
mk
mk
mk
x
xstxLE
a5) estimativas para a segunda ocasião da subamostra de tamanho m
hamm
y
y
mk
ki
i
m /046,1620
92,320 31���
��
��
23
2
2
1
1
2
)/(1159095,219
20
92,3206846,5189
1
)(
)(ˆ hamm
m
y
y
yV
mk
ki
imk
ki
i
m �
�
��
�
�
��
�
���
��
23 )/(1057954,020
1159095,2)(ˆ)(ˆ ham
m
yVyV m
m ���
a6) estimativas para a segunda ocasião da subamostra de tamanho n
hamn
y
y
nmk
mki
i
n /76,1510
60,157 31 ���
���
���
23
2
1
2
12
)/(8263,29
10
60,157213,2509
1
)(
)(ˆ hamn
n
y
y
yV
nmk
mki
nmk
mki
i
i
n �
�
��
�
�
����
���
��
���
23)/(2826,0
10
8263,2)(ˆ)(ˆ ham
n
yVyV
n
n ���
395
Inventário florestal contínuo
hamn
y
y
nmk
mki
i
n /76,1510
60,157 31 ���
���
���
23
2
1
2
12
)/(8263,29
10
60,157213,2509
1
)(
)(ˆ hamn
n
y
y
yV
nmk
mki
nmk
mki
i
i
n �
�
��
�
�
����
���
��
���
23)/(2826,0
10
8263,2)(ˆ)(ˆ ham
n
yVyV
n
n ���
a7) estimativas para a segunda ocasião da amostra de ta-manho nm +
hamnm
y
y
nmk
ki
i
nm /9507,1530
52,478 31 ���
�
���
��
�
23
2
1
2
12
)/(2822064,229
30
52,478897,7698
1
)(
)(ˆ hamnm
nm
y
y
yV
nmk
ki
nm
i
i
i
nm �
�
���
��
�
����
��
�
�
�
23 )/(076073546,030
2822064,2)(ˆ)(ˆ ham
nm
yVyV nm
nm ���
� �
�
hamyVys nmnm /275814,0076073546,0)(ˆ)(3
�����
a8) limite de erro para a estimativa nmy + (segunda ocasião)
%46,31009507,15
275814,02100
)()( ��
�
��
�
�
�
�
�
nm
nm
nmy
ystyLE
a9) estimativas do incremento para a subamostra de tamanho m
396
Amostragem em inventário florestal Waldenei Travassos de Queiroz
a10) limite de erro da estimativa do incremento consideran-do a subamostra m (parcelas permanentes)
%83,1210014,5
329826,02100
)()( ��
�
��
�
�
m
m
md
dstdLE
a11) estimativas do incremento para as subamostras de tamanhos n e k
hamxyd knnk /319,5441,1076,15 3�����
23)/(983119,0
20
009788,14
10
8263,2)(ˆ)(ˆ)(ˆ ham
k
xV
n
yVdV kn
nk �����
a12) estimativas do incremento considerando as subamos-tras nm + e mk +
hamxyd mknmmknm /2772,56735,109507,153
))(( ���������
))((
),(ˆ2)(ˆ)(ˆ)(ˆ
nmmk
yxVm
mk
xV
nm
yVdV mmknm
��
�
�
�
�
���
23 )/(211460,03040
16312,4202
40
9663,10
30
2822,2)(ˆ hamdV �
�
������
hamdVds /4598478,0211460,0)(ˆ)( 3���
a13) limite de erro da estimativa do incremento consideran-do as subamostras nm + e mk +
%43,171002772,5
4598478,02100
)()( ��
���
��
d
dstdLE
b) estimativas ASP para a primeira ocasião
b1) estimativa da média xµ
397
Inventário florestal contínuo
Dado que:
Tal que:
9675322,11159095,2
16312,4
)(ˆ
),(ˆˆ ���
yV
yxVB
m
m
xy
976733,01159095,23861937,8
16312,4
)(ˆ)(ˆ
)],(ˆ[ˆ
22
2�
��
�
�
yVxV
yxV
mm
m�
Então:
)(ˆ)(ˆˆmnnmkmkx
yycxxax ������
)046,1676,15(39168337,0)906,10441,10(5972208,0441,10ˆ �����x�
hamx /606686,10ˆ 3��
b2) estimativa da variância )ˆ(ˆxV µ
]ˆ))((
ˆ1[
)(ˆ)ˆ(ˆ
2
2
�
��
knnmmk
mn
mk
xVV
mk
x���
��
��
23 )/(22084983,0)976733,010203040
976733,010201(
40
9663,10)ˆ(ˆ hamV
x�
����
�����
Sendo:
hamVsxx
/469947,022084983,0)ˆ(ˆ)ˆ( 3��� ��
398
Amostragem em inventário florestal Waldenei Travassos de Queiroz
b3) limite de erro da estimativa ASP xµ (primeira ocasião)
%86,8100606686,10
469947,02100
ˆ
)ˆ()ˆ( ��
���
��
x
x
x
stLE
�
��
c) estimativas ASP para a segunda ocasião
c1) estimativa da média yµ
1976504,0976733,01020)1020)(2020(
4964254,02020
ˆ))((
ˆˆ
2
' �������
���
����
�knnmmk
Bkma
yx
m
7962945,06534,1004
)2020(20
ˆ))((
)(ˆ
2
'��
��
���
��
�knnmmk
mkmcn
Dado que:
4964254,03861937,8
16312,4
)(ˆ
),(ˆˆ ���
xV
yxVB
m
m
yx
Então:)(ˆ)(ˆˆ ''
mnnmkmny yycxxay ������
)046,1676,15(7962945,0)]906,10441,10(1976504,0[76,15ˆ ������y
�
hamy /89583279,15ˆ 3��
c2) estimativa da variância )ˆ(ˆyV µ
]ˆ))((
ˆ1[
)(ˆ)ˆ(ˆ
2
2
�
��
knnmmk
km
nm
yVV nm
y���
��
��
23)/(04648966,0)
6534,1004
976733,020201(
30
2822,2)ˆ(ˆ hamV y �
�����
399
Inventário florestal contínuo
Resultando:
hamVs y /215614609,004648966,0)ˆ(ˆ)ˆ(3
��� ��
c3) limite de erro da estimativa ASP yµ (segunda ocasião)
%71,210089583279,15
215614609,02100
ˆ
)ˆ()ˆ( ��
���
��
y
y
y
stLE
�
��
d) estimativas ASP para o incremento
d1) estimativa da média ( dµ )
Dado:
Então:
A estimativa do incremento dµ também pode ser obtida pela expressão:
hamxyd /2891466,5606686,1089583279,15ˆˆˆ 3����� ���
400
Amostragem em inventário florestal Waldenei Travassos de Queiroz
d2) estimativa da variância )ˆ(ˆdV µ
m
yxVba
k
xVb
m
xVb
n
yVa
m
yVaV m
ddk
dm
dn
dm
dd
),(ˆˆˆ2
)(ˆ)ˆ1(
)(ˆˆ)(ˆ
)ˆ1()(ˆ
ˆ)ˆ(ˆ 222 ++++−+=µ
Tal que:
21)ˆ(ˆ VVV d ���
m
xVb
n
yVa
m
yVaV m
d
n
d
m
d
)(ˆˆ)(ˆ
)ˆ1()(ˆ
ˆ 22
1����
m
yxVba
k
xVbV m
dd
k
d
),(ˆˆˆ2
)(ˆ)ˆ1( 2
2���
20
386,8)794871146,0(
10
826,2)187978262,11(
20
116,2187978262,1
222
1 ��������V
424222818,01 �V
20
16312,4)794871146,0(187978262,12
20
01,14)794871146,01( 2
2��������V
363643578,02 ��V
23
21 )/(06057924,0)ˆ(ˆ hamVVV d ����
Sendo:
hamVsdd
/246128503,006057924,0)ˆ(ˆ)ˆ( 3��� ��
d3) limite de erro da estimativa ASP da média do incremen-to ( dµ )
%31,91002891466,5
246128503,02100
ˆ
)ˆ()ˆ( ��
���
��
d
d
d
stLE
�
��
f) discussão dos resultados e conclusões
Os resultados, apresentados na Tabela 10.10, demonstram que os procedimentos com substituição parcial são mais eficien-
401
Inventário florestal contínuo
tes que os seus correspondentes não SPR, pois apresentam va-lores menores para os limites de erro.
tabela 10.10 - Limites de erro das principais estimativas.
Estimadores Estimativas Limites de erro
mkx + 10,6735 9,81
nmy + 15,9507 3,46
mknm xyd ++ −= 5,2772 17,43
md 5,1400 12,83
xµ 10,6067 8,86
yµ 15,8958 2,71
dµ 5,2891 9,31
Definindo-se eficiência como a razão entre os limites de erro, têm-se:
f1) estimador xµ versus mkx +
1072,1%86,8
%81,9100
)ˆ(
)(����
�
x
mk
LE
xLEEf
�
O estimador da primeira ocasião xµ é 10,72% mais eficien-te que o estimador .mkx +
f2) estimador yµ versus nmy +
2768,1%71,2
%46,3100
)ˆ(
)(����
�
y
nm
LE
yLEEf
�
O estimador da segunda ocasião yµ é 27,68% mais efi-ciente que o estimador .nmy +
402
Amostragem em inventário florestal Waldenei Travassos de Queiroz
f3) estimador dµ versus mknm xyd ++ −=
8722,1%31,9
%43,17100
)ˆ(
)(����
dLE
dLEEf
�
O estimador para o incremento médio entre as duas ocasi-ões dµ é 87,22 % mais eficiente que o estimador .mknm xyd ++ −=
f4) estimador dµ versus mmm xyd −=
3781,1%31,9
%83,12100
)ˆ(
)(����
d
m
LE
dLEEf
�
O estimador para o incremento médio entre as duas ocasi-ões dµ é 37,81 % mais eficiente que mmm xyd −= (parcelas per-manentes).
cApítulo 11
FormA e tAmAnho dAs unIdAdesde AmostrA
Mostra a importância em utilizar um tamanho adequado de unidade de amostra em inventário florestal, explanando ser ló-gico existir um intervalo ideal de tamanhos, onde a eficiência é máxima e o custo é mínimo. Aborda os principais fatores que influenciam o tamanho e a forma das parcelas. Apresenta pes-quisas comparando a eficiência em relação ao nível de precisão de inventários florestais, considerando diversos tamanhos de unidades de amostra. Discorre sobre vários métodos para obter o tamanho ideal da parcela quando a precisão estatística é o critério utilizado.
405
Forma e tamanho das unidades de amostra
Inicialmente, pode-se afirmar não existir empecilho de or-dem teórica em utilizar qualquer tamanho de parcela para obter estimativa não-tendenciosa do volume de madeira de uma flo-resta, obviamente, desde que a sua localização seja não-ten-denciosa. Por outro lado, é lógico supor a existência de um in-tervalo ideal de tamanhos, onde a eficiência é máxima e o custo é mínimo.
Dentre os principais fatores que influenciam o tamanho e a forma das parcelas, destacam-se: o objetivo do inventário flo-restal, o grau de precisão desejado e a variabilidade da variável resposta.
As pesquisas têm demonstrado que comparando a efici-ência em relação ao nível de precisão de inventários florestais, considerando a mesma fração amostral, a precisão aumenta à medida que os tamanhos das unidades se tornam menores. Obviamente, os custos aumentam, pois, as parcelas tornam-se mais numerosas. As pesquisas recomendam o uso de parcelas que contenham um número de árvores representativo, que não seja demasiadamente grande face ao tempo requerido para me-dição. Husch (1971) recomenda um tamanho que englobe em torno de um número básico de 20 árvores.
Queiroz (1977), pesquisando na Amazônia os efeitos da va-riação estrutural das unidades de amostra no processo de amos-tragem por conglomerado, para o volume de madeira para árvo-res com DAP ≥ 30 cm, verificou que o coeficiente de variação decresceu exponencialmente com o tamanho da subunidade de amostra, estabilizando-se levemente quando o tamanho atingiu em torno de 0,25 ha a 0,32 ha, tamanho considerado ideal.
Silva (1980), também pesquisando na Amazônia e consi-derando a variável resposta volume de madeira para todas as árvores com 15 cm ,4515 cmDAPcm ≤≤ 45 cm, verificou o tamanho ideal de
406
Amostragem em inventário florestal Waldenei Travassos de Queiroz
0,09 ha, e para o volume de árvores com DAP ≥ 45 cm encon-trou o tamanho ideal de 0,25 ha.
Higuchi et al. (1982), com base em 32 diferentes tamanhos de parcelas, em floresta de terra firme com DAP ≥ 25 cm lo-calizada no Distrito Agropecuário da Superintendência da zona Franca de Manaus-SUFRAMA, no estado do Amazonas, estu-daram o tamanho ideal para inventários florestais, concluindo pelo tamanho ideal de 37,5 m x 150 m (0,5625 ha). O critério utilizado por esses autores para a seleção foi a Eficiência Relati-va (ER %), segundo Husch, Miller e Beers (1972), que relaciona o custo de medição e a precisão desejada, através da fórmula
100%
22
11�
�
�
�
CSE
CSEER
, sendo:
SE1 = desvio padrão considerando a parcela padrão de ta-manho 5 m x 200 m;
SE2 =desvio padrão do tamanho da parcela a ser compa-rada;
1C = custo de medição da parcela básica;2C = custo de medição da parcela a ser comparada.
Péllico Netto (1979) introduziu o conceito de eficiência por dia de trabalho (EDT), objetivando considerar alguns fatores re-levantes na definição do tamanho da unidade de amostra, como: o tamanho da área a ser inventariada, os tempos de desloca-mento, os tempos de medição, o número de horas a trabalhar por dia, as condições de acesso à área e dentro dela, assim como as adversidades que dificultam a penetração na floresta.
21
)1(
v
An
v
nn
Af
EDT d
d
�
�
� , tal que:
407
Forma e tamanho das unidades de amostra
Af = tamanho da área a ser inventariada;n = tamanho da amostra;
dn = número de unidades medidas por dia de trabalho;A = área da unidade de amostra;
1v = velocidade de caminhamento entre unidades de amostra;2v = velocidade de medição das unidades de amostra.
Substituindo EDT = 8 horas, carga horária por dia, na equa-ção desenvolvida, o autor achou a seguinte fórmula para a ob-tenção do tamanho ótimo para a unidade de amostra:
2
1
1
]
)1(8
[ vnv
nn
afv
Ad
d ��
�
No que concerne à forma de parcela em inventários flores-tais, as pesquisas mostram que a forma da unidade de amostra não influencia na precisão e na exatidão nos diversos métodos de amostragem, e que os principais fatores que influenciam a definição da forma são o perímetro e a facilidade do estabele-cimento em campo. Sob o ponto de vista teórico, as unidades circulares são as mais eficientes, devido possuírem a maior rela-ção entre a área e o perímetro, resultando na redução da proba-bilidade de ocorrência de árvores limítrofes, tornando mais exato o cálculo do volume na parcela.
Em inventários de florestas naturais na Amazônia, parcela grande com forma circular apresenta dificuldades na implanta-ção e medição devido o controle das árvores limítrofes, assim como tornam difícil a operacionalização do trabalho de campo, por causa da grande densidade de árvores no sub-bosque.
As parcelas retangulares, com largura de 20 m no máximo, são muito utilizadas em inventários de florestas tropicais natu-rais, principalmente devido à facilidade de implantação e me-
408
Amostragem em inventário florestal Waldenei Travassos de Queiroz
dição. Entretanto, apresentam a desvantagem de maximizar a ocorrência de árvores na bordadura. Uma vantagem importante das parcelas retangulares de comprimento longo em relação à largura é a possibilidade de estudar a variação da tipologia e, através de um processo de pós-estratificação, tornar possível a elaboração de mapas florestais, que são importantes para pla-nejar o manejo de uma floresta.
11.1 MÉTODOS PARA OBTER O TAMANHO IDEAL
Existem vários métodos para obter o tamanho ideal da par-cela quando a precisão estatística é o critério utilizado, desta-cando-se entre eles:
a) método da curvatura máxima
É o método mais antigo, proposto por Federer (1955), o qual consiste na obtenção dos dados inerentes às unidades básicas, combinadas de forma a se ter valores para vários ta-manhos de parcela. Calcula-se, para os vários tamanhos, um parâmetro ou índice que estime variabilidade, como variância, coeficiente de variação ou erro padrão. Os valores do índice de variação e os diversos tamanhos de parcela são plotados em um sistema de eixos coordenados e, a partir do gráfico, é obtido o ponto de curvatura máxima, o qual é definido como o ponto a partir do qual os valores do índice de variabilidade utilizado co-meçam a estabilizar. Esse ponto determina o tamanho ideal da unidade de amostra.
Este método possui duas desvantagens: 1) Não considera os custos dos inventários considerando
os diferentes tamanhos de parcelas.
409
Forma e tamanho das unidades de amostra
2) O ponto de curvatura máxima depende do menor tama-nho de parcela usada, como também da escala utilizada.
Objetivando dar uma ideia acerca da variabilidade do coefi-ciente de variação em função do tamanho da unidade de amos-tra, seja o experimento apresentado por Queiroz (1977), o qual considerou 25 unidades básicas de 400 m2 em um inventário de uma área de 5.324,04 ha, localizada na Floresta Nacional do Ta-pajós, no município de Santarém - estado do Pará. A Tabela 11.1 apresenta os valores dos coeficientes de variação considerando os 25 tamanhos de parcelas e a Figura 11.1 mostra o gráfico construído a partir destes dados.
tabela 11.1 - Valores dos coeficientes de variação por tamanho de parcela.
Parcelas (m2) CV% Parcelas (m2) CV% Parcelas (m2) CV%
400800120016002000 2400280032003600
101,08 75,04 67,86 58,51 53,56 48,78 44,45 41,62 39,74
400044004800520056006000640068007200
40,1539,1637,5135,9434,9234,8833,4731,8730,51
760080008400880092009600
10000
27,7929,5129,3328,2728,2327,9627,95
410
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Co
efi
cie
nte
de
vari
ação
(%
)
Figura 11.1- Comportamento do coeficiente de variação em função do tama-nho da parcela.
O modelo matemático ,2
1
aAaCV � ajustado sob a transfor-
mação logarítmica ,logloglog 10211010 AaaCV �� apresentou os seguintes resultados:
ACv 1010 log410743,0077164,3log ��
F=3097,43
�2
ajr 0,9923
De acordo com Hoffmann e Vieira (1977), o coeficiente de determinação ajustado para os graus de liberdade é dado pela expressão:
)1(2
1 222 rn
rraj
�
�
��
Tal que:
TOTAL
REGRESSÃO
SQ
SQr �2
n = número de observações
411
Forma e tamanho das unidades de amostra
b) método modificado da máxima curvatura
Considerando que o ponto de curvatura máxima é geral-mente determinado por inspeção visual e que é possível ajustar uma curva para o parâmetro índice de variabilidade em função do tamanho da parcela, define-se que o tamanho ótimo corres-ponderá à abscissa, tal que a derivada da função seja igual a – 1. Isso significa dizer que, depois deste ponto, o incremento de uma nova unidade básica resultará numa redução da variável dependente - o coeficiente de variação - menor que a unidade, denotando ser inviável promover aumentos adicionais na parce-la a ser eleita.
c) método do índice de heterogeneidade
Ferreira (1996) cita que esse método foi proposto por Smi-th (1938) e baseia-se numa relação empírica entre o tamanho da parcela e a variância, estabelecendo uma dependência negativa expressa pelo modelo matemático
ba
k k
VV = , tal que quando o ta-
manho relativo da parcela aumenta, a variância relativa diminui. Neste modelo matemático, têm-se:
kV = variância por unidade de área entre as parcelas de tamanho correspondente a k unidades básicas;
aV = variância considerando as parcelas correspondentes em tamanho à unidade básica;
k = número de unidades básicas utilizado por parcela;b = índice de heterogeneidade medido pela correlação en-
tre unidades básicas adjacentes.Então, tem-se o modelo ,logloglog kbVV ak −= depreen-
dendo que o índice de heterogeneidade b é o coeficiente de
412
Amostragem em inventário florestal Waldenei Travassos de Queiroz
regressão, de modo que a variável dependente é o logaritmo da variância entre as parcelas de tamanho correspondente a k unidades básicas e a variável independente é o logaritmo do nú-mero de unidades básicas correspondentes da parcela.
De acordo com Smith (1938), a fórmula para obter o valor de k, tornando mínimo o custo por unidade de informação é:
2
1
)1( cb
bck
�
�
Tal que:1c = custo associado somente ao número de parcelas;2c = custo por unidade de área.
consIderAções FInAIs
Aborda sobre as dificuldades no uso de análise estatísti-ca em inventários florestais, citando que é notória a dificuldade enfrentada pelos estudantes e profissionais devido à falta de ex-periência no contexto de aplicações dos métodos estatísticos, principalmente na aplicação de técnicas estatísticas multidimen-sionais. Discorre sobre inventário para subsidiar a operacionali-zação de um projeto de manejo florestal que, obrigatoriamente, define, distingue e delimita as comunidades com características fitossociológicas semelhantes, ressaltando que os métodos es-tatísticos univariados não oferecem o suporte suficiente para atender a essas análises. Descreve que as soluções para es-ses questionamentos só podem ser obtidas pelo uso de análise multivariada. Discute sobre a adequacidade do uso de algumas técnicas multivariadas em inventários florestais.
415
O objetivo principal deste livro é orientar o aprendizado no campo da análise estatística univariada, visando ao planejamen-to de inventário florestal, no qual é notória a dificuldade enfren-tada pelos estudantes e profissionais, principalmente, devido à falta de livros didáticos escritos em português, em linguagem adequada ao contexto dos métodos estatísticos.
Por outro lado, este livro é uma pequena contribuição na difícil tarefa de resolver os problemas da análise de inventários florestais, principalmente de florestas naturais, destarte não ob-jetiva apresentar todos os métodos estatísticos, com vista a sub-sidiar a análise de inventário para o manejo florestal sustentável, visto a complexidade requerida para se atender tal fim. A seguir algumas considerações para aguçar a discussão sobre o pro-blema.
O inventário para subsidiar a operacionalização de um projeto de manejo florestal, obrigatoriamente, define, distingue e delimita as comunidades com características fitossociológicas semelhantes; e, obviamente, os métodos estatísticos univaria-dos não oferecem o suporte suficiente de análise para atender esse objetivo.
As experiências na Amazônia demonstram que estratifica-ções estabelecidas mediante a interpretação de fotocoberturas, apesar de importante e informativa, não são capazes de expli-car, com o detalhamento requerido, as inter-relações das vari-áveis envolvidas, principalmente, nas vegetações localizadas nos sub-bosques da floresta. O direcionamento indicado seria compatibilizar os recursos de sensoriamento remoto e de plane-jamento de amostragem – recomenda-se o uso da amostragem sistemática - a uma análise estatística multivariada.
A análise multivariada apresenta algumas complexidades com relação à compreensão de sua teoria estatística e à compu-
416
tação das análises dos dados. Entretanto, sob o ponto de vista prático da explicação dos efeitos das características fitossocio-lógicas, é inegável ser um instrumento poderoso para interpretar as correlações inter e intra dos tipos florestais, o que os recursos disponíveis através dos diversos índices fitossociológicos unidi-mensionais existentes na literatura deixam a desejar, principal-mente, por não apresentarem estruturas de lógica matemática e de método estatístico.
O problema mais complexo em termos de inventário para o manejo de florestas naturais é a análise do inventário contínuo com parcelas permanentes, o qual tem o objetivo de explicar a tendência de crescimento da floresta. Para subsidiar a estrutura-ção dos tratos silviculturais a serem aplicados na recomposição da floresta tropical, destaca-se que, obrigatoriamente, a análise estatística deverá ter em mira detectar e classificar os agrupa-mentos de espécies que possuam as mesmas tendências de desenvovimento (perfis de crescimento).
As soluções para os questionamentos acima descritos só podem ser obtidas pelo uso de análise multivariada e, em alguns problemas, até recomenda-se a aplicação conjunta de vários métodos multivariados.
As técnicas multivariadas de componentes principais e análise de fatores podem ser utilizadas para diminuir a dimen-sionalidade dos dados, o que possibilitará, a partir de um número menor de variáveis, explicar mais facilmente suas inter-relações. A análise de componente principal e a análise de fatores são im-portantes para construir índices fitossociológicos e a partir deles produzir mapas delimitando as comunidades florestais.
As técnicas de análises de agrupamento, de discriminante e de análise de variância multivariada, podem ser usadas con-juntamente para delimitar, classificar e comparar – discriminar
417
– tipos florestais e, assim, obter mapas de vegetação baseados nas variáveis mais importantes na explicação das estruturas flo-rística e ecológica da vegetação.
É importante no manejo florestal estudar as inter-relações entre grupos de variáveis. Por exemplo, um grupo pode ser for-mado por variáveis florísticas e o outro pelas variáveis que refle-tem a fertilidade de solo. A análise de correlação canônica pode-rá explicar essas correlações, fornecendo inclusive mapas mos-trando a estratificação das diversas relações solo-vegetação.
Em relação à análise de inventário florestal contínuo com parcelas permanentes, a análise multivariada denominada de medidas repetidas, através das técnicas de análises de levanta-mentos longitudinais, podem atender ao objetivo de obter grupos formados por espécies com a mesma tendência de crescimento.
419
reFerêncIAs
BANZATTO, D. A.; KRONKA, S. N. experimentação agronômi-ca. Jaboticabal: FUNEP, 1989. 247 p.
BARBIN, D. componentes de variância: teoria e aplicação. 2. ed. Piracicaba: FEALQ, 1993. 120 p.
BOLFARINE, H.; BUSSAB, W. O. elementos de amostragem. São Paulo: Edgard Blücher, 2005. 269 p.
BORGES, B. H. Projeto de manejo florestal da Fazenda San-ta lúcia: serraria marajoara. Belém: IBAMA, 1990.
CAMPOS, H. Amostragem. Piracicaba: ESALQ, 1981. Apostila.
CHACIN LUGO, F. Tamaño de parcela experimental y su forma. revista de la Facultad de Agronomia, Maracay, v. 9, n. 3, p. 55-74, 1977.
COCHRAN, W. G. sampling techniques. 3. ed. New York: J. Wiley, 1977. 428 p.
______. técnicas de amostragem. Rio de Janeiro: Fundo de Cultura, 1965. 555 p.
CUNIA, T. two successive measurements: the SPR model no auxiliary variables. Syracuse: [s. n.], 1974.
CUNIA, T.; CHEVROU, R. B. Sampling with partial replacement on three or more occasions. Forest science, Lawrence, v. 15, p. 204-224, 1969.
FEDERER, W. T. experimental design, theory and applica-tion. New York: Macmillan, 1955. 593 p.
420
FERREIRA, P. V. estatística experimental aplicada à agrono-mia. 2. ed. Maceió: EDUFAL, 1996. 606 p. FLORES, O. M. M. estudo comparativo de tamanhos e dis-tâncias em processo de amostragem por conglomerado. 2010. 67 f. Dissertação (Mestrado em Ciências Florestais) – Uni-versidade Federal Rural da Amazônia, Belém, 2010. FONSECA, J. S.; MARTINS, G. A. curso de estatística. 3. ed. São Paulo: Atlas, 1982. 286 p. FREESE, F. elementary forest sampling. Washington: USDA, 1962, 91 p. (Handbook, 232). GOMES, F. P. curso de estatística experimental. 14. ed. Pira-cicaba: ESALQ, 2000. 477 p.GOMES, F. P.; NOGUEIRA, I. R. Análise matemática. 2. ed. Piracicaba: Augegraf, 1980. 371 p. HOFFMANN, R.; VIEIRA, S. Análise de regressão: uma intro-dução à econometria. São Paulo: HUCITEC; EDUSP, 1977. 339 p. HIGUCHI, N. et al. Tamanho de parcela amostral para inventá-rios florestais. Acta Amazônica, Manaus, v. 12, n. 1, p. 91-103, 1982. HUSCH, B. Planificacion de un inventario florestal. Roma: FAO, 1971. 135 p. HUSCH, B.; MILLER, C. L.; BEERS, T. W. Forest mensuration. 3. ed. New York: J. Wiley, 1972. 402 p. LOETSCH, F.; HALLER, K. E. Forest inventory. Minchin: BLV Verlagsgesellschaft, 1964. MOOD, A. M.; GRAYBILL, F. A.; BOES, D. C. Introduction to the theory of statistics. 3. ed. New York: Mc Graw-Hill, 1964. 564 p. PÉLLICO NETTO, S.; BRENA, D. A. Inventário florestal. Curi-tiba, 1997. 316 p.
421
PÉLLICO NETTO, S. plano de colonização do Alto turi. In-ventário Florestal. Curitiba: Centro de Pesquisas Florestais da UFPR, 1971. 238 p.PÉLLICO NETTO, S. die Forstinventuren in Brasilien- neue entwicklungen und ihr Beitrag für eine geregelte Forstwirts-chaft. 1979. 232 f. Tese (Doutorado em Engenharia Florestal) - Mitteilungen aus dem Arbeitskreis für Forstliche Biometrie, Frei-burg,1979. PINHEIRO, J. G. Análise da eficiência das estimativas por razão em conglomerados em inventário florestal na Amazô-nia. 2011. 46 f. Dissertação (Mestrado em Ciências Florestais) – Universidade Federal Rural da Amazônia, Belém, 2011. PISKOUNOV, N. cálculo diferencial e integral. 4. ed. Porto: Lopes da Silva, 1978. v. 2. QUEIROz, W. T. Análise de fatores (“Factor analysis”) pelo método de máxima verossimilhança: aplicação ao estudo de estrutura de florestas tropicais. 1984. 112 f. Tese (Doutorado em Engenharia Florestal) – Escola Superior de Agricultura Luiz de Queiroz, Piracicaba, 1984. ______. Análise univariada de inventários florestais contínuos: parcelas permanentes. Boletim da FcAp, Belém, n. 21, p. 33-49, dez. 1993a. ______. Estimativa por razão: aplicação em levantamentos flo-restais. Boletim da FcAp, Belém, n. 21, p. 51-63, dez. 1993b. ______. efeitos da variação estrutural em unidades amos-trais na aplicação do processo de amostragem por conglo-merados nas florestas do Planalto do Tapajós. 1977. 109 f. Dissertação (Mestrado em Engenharia Florestal) – Universidade Federal do Paraná, Curitiba, 1977. ______. o modelo de amostragem com substituição parcial (spr) para duas mensurações sucessivas. Trabalho apre-
422
sentado no Seminário da Pós-Graduação. Piracicaba: ESALQ, 1983.______. Técnicas de amostragem em inventário florestal nos trópicos. Belém: FCAP. Serviço de Documentação e Infor-mação, 1998. 147 p. ROLLET, B.; QUEIROZ, W. T. Observações e contribuições aos inventários florestais na Amazônia. In: CONGRESSO FLORES-TAL BRASILEIRO, 3., 1978, Manaus. Anais... São Paulo: So-ciedade Brasileira de Silvicultura, 1978. v. 2, p. 405-408. (Edição especial da revista Silvicultura, n. 14). SANQUETTA, C. R. et al. Inventários florestais: planejamento e execução. 2. ed. Curitiba: Multi-Graphic, 2009. 316 p. SHIVER, B. D. BORDER, B. E. sampling techniques for forest resource inventory. New York: Jhon Wiley e Sons, 1996. 356 p. SATTERTHWAITE, F. E. An approximate distribution of estima-tes of variance components. Biometrics, Washington, n. 2, p. 110-114, 1946. SCOLFORO, J. R. Inventário florestal. Lavras: ESAL - FAEPE, 1993. SEARLE, S. R. linear models. New York: J. Wiley, 1971. 532 p. SILVA, J. N. M. Eficiência de diversos tamanhos e formas de unidades de amostras aplicadas em inventário florestal na região do Baixo tapajós. 1980. 83 f. Dissertação (Mestrado em Engenharia Florestal) – Universidade Federal do Paraná, Curiti-ba, 1980. SMITH, H. F. An empirical law describing heterogeneity in the yields of agricultural crops. journal of Agricultural science, Cambridge, n. 28, p. 1-23, 1938. SUPERINTENDêNCIA DO DESENVOLVIMENTO DA AMA-ZÔNIA. Levantamentos florestais realizados pela missão FAO
423
na Amazônia (1956-1961). Belém: Divisão de Documentação, 1974. v. 1. STEEL, R. G. D.; TORRIE, J. H. principles and procedures of statistics with special biological sciences. New York: Mc Grall-Hill, 1960. 481 p. YARED, J. A. G. comportamento e viabilidade de procedi-mento de cordia alliodora (ruiz e pav.) okem, no planalto do tapajós – Belterra, pA. 1983. 108 f. Dissertação (Mestrado em Engenharia Florestal) – Escola Superior de Agricultura Luiz de Queiroz, Piracicaba, 1983. WARE, K. D.; CUNIA, T. Continuos forest inventory with partial replacemente of samples. Forest science monograph, Wa-shington, n. 3, 1962. VRIES, P. G. sampling theory for inventory: a teach-yourself course. New York: Springer-Verlag, 1986. 399 p.
425
glossárIo
Acurácia: é o grau de precisão de uma quantidade medida ou calculada em relação ao seu verdadeiro valor.
Ajustamento de curvas: procedimento matemático destinado a obter o modelo mais ajustado entre duas ou mais variáveis – uma dependente (Y) e outra(s) independente(s).
Aleatório: ao acaso, randômico. Seja uma população composta por N indivíduos e deseja-se retirar uma amostra de tamanho n. A amostra será aleatória se a chance de cada indivíduo ser selecionado for igual a .N
n .
Alfa (a ): denominado como erro tipo I, constitui a probabilidade de aceitação de 0H (hipótese de nulidade) quando ela for falsa, ou seja, quando ela não deveria ser aceita.
Amostra: é uma parte da população selecionada para represen-tar a mesma.
Amostragem: quando trabalhamos com uma parte da popula-ção (amostra).
Amostra probabilística: toda amostra que permite fazer infe-rência sobre a população.
Amostragem com reposição: método de amostragem no qual cada unidade da população selecionada para compor a amostra é reposta à população antes da retirada da próxima unidade.
Amostragem estratificada: é o processo que consiste em divi-dir a população de tamanho igual a N unidades, em subpopula-ções ou estratos constituídos de iN unidades, respectivamente, tal que não haja superposições e, juntas, totalizem a população de tamanho .∑ =
ii NN
426
Amostragem por conglomerados ou grupos: é uma variação de qualquer processo de amostragem que, em vez de utilizar unidades de amostra individuais, a unidade de amostra é forma-da por grupo de pequenas subparcelas.
Amostragem sem reposição: método de amostragem no qual a unidade de amostra selecionada para compor a amostra não é reposta na população antes da retirada da próxima unidade.
Amostragem simples ao acaso: é uma amostragem probabi-lística em que todos os indivíduos têm a mesma probabilidade de serem sorteados.
Amostragem sistemática: consiste em sortear uma unidade da população e, a partir dela, para constituir uma amostra de tama-nho n, selecionar as unidades que ocupam pela ordem sequen-cial as posições múltiplas do valor da razão entre o número total N de unidades e o número n de unidades da amostra.
Amostras independentes: os conjuntos amostrais de valores não estão relacionados entre si.
Biometria ou Bioestatística: estatística aplicada às ciências biológicas.
censo: mensuração de todos os indivíduos da população.
Coeficiente de correlação intraconglomerado: é o coeficiente que explica o grau de homogeneidade entre subparcelas dentro do conglomerado. Quando maior que zero, a amostragem por con-glomerados é menos precisa que a simples ao acaso, e quando menor que zero, a amostra por conglomerado é mais precisa que a simples ao acaso. Essas amostragens possuem a mesma pre-cisão se o coeficiente de correlação intraconglomerado for zero.
Coeficiente de variação: é a estatística que permite avaliar a variabilidade das observações, buscando-se uma comparação relativa entre o desvio padrão e a média.
427
correlação: é a estatística que mede a magnitude e o sentido do grau de associação entre duas variáveis aleatórias.
correlação linear: é a estatística que mede a magnitude e o sentido (positivo ou negativo) do grau de associação linear entre duas variáveis aleatórias.
covariância: é a estatística que mede a tendência à variação si-multânea, em grandeza e sinal, das observações inerentes a duas variáveis aleatórias. É a média (ou esperança matemática) do pro-duto dos afastamentos de cada variável em relação à respectiva média (ou esperança matemática): Cov(x,y) = E[x – E(x) (y – E(y)].
curva “t” de student: distribuição de probabilidade que apre-senta as seguintes características: distribuição simétrica; curva mesocúrtica; platicúrtica ou leptocúrtica, dependendo dos graus de liberdade. Quando a forma é mesocúrtica se assemelha à distribuição normal.
delineamento experimental: é o plano estabelecido na mon-tagem do experimento e implica na forma como os tratamentos serão designados às unidades amostrais. Há um entendimento sobre as análises estatísticas a serem efetuadas quando todos os dados estiverem disponíveis.
desvio padrão: é a medida de dispersão que determina a varia-bilidade entre cada escore e a sua respectiva média da popula-ção ou da amostra. É a raiz quadrada da variância.
dimensionamento da amostra: é obter o tamanho da amostra considerando um determinado nível de significância e um limite de erro ou margem de erro.
distribuição amostral: distribuição de probabilidade de uma estatística induzida pelo plano amostral.
distribuição normal: modelo de distribuição de probabilidades de variáveis aleatórias contínuas. A curva apresenta as seguin-
428
tes características: distribuição simétrica; forma de sino; dois pontos de inflexão; é assintótica.
distribuição probabilística: é o conjunto de duas variáveis; uma que é aleatória (abscissa) e outra que representa as res-pectivas probabilidades (ordenada).
eixo das abscissas: eixo horizontal dos valores, por exemplo, de iX do plano cartesiano.
eixo das ordenadas: eixo vertical dos valores, por exemplo, de
iY do plano cartesiano.
erro ou viés ou Bias: erro casual observado nas amostras ale-atórias, decorrente da variabilidade dos elementos constituintes do universo estudado, pelo fato de que nem todos os indivíduos da população participam da amostra. É um erro que pode levar à conclusão equivocada sobre a população, podendo ocorrer: na seleção da amostra; na coleta dos dados; na análise dos dados; nas conclusões.
erro padrão: estatística que mede a variabilidade das médias amostrais. É o desvio padrão de uma população de médias amostrais, o qual corresponde ao quociente do desvio padrão pela raiz quadrada do tamanho da amostra.
erro tipo I ou erro alfa (a ): é um erro que pode ser cometido na inferência estatística que consiste em rejeitar a hipótese de nulidade quando ela é verdadeira.
erro tipo II ou erro beta ( β ): é um erro que pode ser cometido na inferência estatística que consiste em aceitar a hipótese de nulidade quando ela é falsa.
espaço amostral ou universo: é o conjunto dos pontos amos-trais.
429
esperança matemática de uma variável contínua E(y): seja y uma variável aleatória contínua; definimos como
���
��� dyyyfyE )()( , tal que )(yf é a função de densidade.
esperança matemática de uma variável discreta )(yE : seja y uma variável aleatória discreta que assume os valores
nyyy ,,, 21 L com as respectivas probabilidades nppp ,,, 21 L , então ∑=
iii pyyE )( .
estatística: é a parte da matemática aplicada que estuda dados originados de observações.
estatísticas: são valores numéricos que descrevem as amos-tras como a média, a mediana, a variância, etc.
estimação por intervalo: quando a partir da amostra constrói-se um intervalo com certa probabilidade de conter o verdadeiro valor do parâmetro populacional.
estimação: quando se usa os resultados extraídos da amostra para produzir inferências sobre a população da qual foi extraída aleatoriamente a amostra.
estimador: denomina-se estimador de um parâmetro de uma população a função de elementos de uma amostra oriunda des-sa população, que mantém com o mesmo uma relação.
estimativa por razão: quando se estima o valor de uma variá-vel associada à outra variável; normalmente essas variáveis são correlacionadas.
estimativa: é um valor específico de um estimador como, por exemplo, a média aritmética da altura de uma amostra de árvores.
Estratificação com repartimento ótima: quando o dimensio-namento da amostra tem em vista tornar mínimo o valor da va-riância da média estratificada dentro de um limite de custo para medição da amostra, ou tornar mínimo o custo para um valor estipulado da variância da média estratificada.
430
Estratificação com repartimento, partilha ou alocação pro-porcional: quando o dimensionamento da amostra é feito consi-derando a mesma fração amostral para todos os estratos.
experimento ou ensaio: é um trabalho que segue determina-dos princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos ou populações.
Fator de expansão ou crescimento: é o fator que transforma os resultados da amostra para a população. É o quociente entre o número de unidades da população pelo número de unidades da amostra.
Fração amostral na população: é a razão entre o número de unidades medidas na amostra e o número de unidades total da população.
Fração amostral no estrato: é a razão entre o número de unida-des medidas no estrato e o número de unidades total do estrato.
Função de probabilidade: uma função f (y) de variável discreta, tal que, f (y) 0)( ≥yf 0 e 1)( =∑
x
yf f (y) = 1.
Função densidade: uma função f (y) de variável contínua, tal que f (y) 0)( ≥yf 0 e � �
xdyyf 1)( f (y) dy = 1.
geoestatística: é um conjunto de técnicas usadas para inferir valores para uma determinada variável. Produz estimativas de variáveis com base na probabilidade e na espacialidade das ob-servações.
graus de liberdade: são os indexadores estatísticos correspon-dentes ao número de observações independentes.
heterogeneidade de variâncias ou heterocedasticidade: é quando ocorre desigualdade de variâncias, o que pode ser veri-ficado através de vários testes.
431
hipótese Alternativa ( HA ): é a hipótese que é aceita quando a hipótese de nulidade é rejeitada, no sentido de afirmar que há diferenças ou associações entre os grupos objetos da pesquisa, as quais não podem ser explicadas pelo acaso.
hipótese da nulidade ( H0 ): é a hipótese que se testa conside-rando que as possíveis diferenças ou associações encontradas entre grupos objetos do estudo são devido ao acaso.
hipótese estatística: é a especificação de um dos parâmetros de uma população ou da relação entre os parâmetros de duas ou mais populações.
Inferência estatística: é o procedimento de efetuar conclusões acerca de uma população baseado em uma amostra desse uni-verso.
Intervalo de confiança: quando a partir da amostra constrói-se um intervalo com certa probabilidade de conter o verdadeiro valor do parâmetro populacional para um determinado nível de confiança (1 – a), tal que a é o nível de significância do teste.
Krigagem: dentro da geoestatística é um conjunto de técnicas usadas para inferir valores para uma variável distribuída no es-paço em locais não amostrados.
limite de erro ou margem de erro: é a semiamplitude do inter-valo de confiança expresso em porcentagem da média.
Média estratificada estimada: é o valor médio não tendencioso que estima o valor médio populacional. É uma média ponderada pelo peso representativo de cada estrato.
parâmetro: é uma função do conjunto de valores (uma caracte-rística) de uma população.
peso do estrato: é razão entre o número de unidades total do estrato e o número total de unidades da população.
432
plano amostral: documento de registro descrevendo os méto-dos e medidas para obtenção da amostragem.
ponto amostral: cada acontecimento que possa ocorrer em um experimento.
população: é o conjunto de todos os indivíduos ou unidades sobre os quais se deseja estabelecer determinados estudos.
população amostrada: população da qual foi retirada a amos-tra.
População finita: quando a amostra se constitui no mínimo de 5% dos indivíduos da população.
População infinita: quando a amostra se constitui no máximo de 5% dos indivíduos da população.
população objetivo: população que se pretende atingir.
probabilidade: é a mensuração matemática usada para des-crever a chance de ocorrência de um valor específico de uma variável aleatória ou de eventos amostrais.
p-valor ou p(valor): é a probabilidade, na inferência estatística, de se cometer um erro de conclusão - Erro tipo I -, rejeitando-se a Hipótese de nulidade se ela for verdadeira.
razão: é o quociente entre os valores de duas variáveis.
repetições: é o mesmo tratamento aplicado a mais de uma uni-dade de amostra da mesma população.
semivariograma: estuda e descreve a variabilidade espacial do fenômeno. Denominada também de análise estrutural ou mode-lagem do variograma.
seleção não probabilística: qualquer processo intencional de escolher as unidades de amostra ou quando não seja possível estabelecer as probabilidades de inclusão das mesmas.
433
seleção probabilística: processo de selecionar as unidades de amostra que permite estabelecer as probabilidades das mesmas pertencer à amostra.
teste de hipótese: quando a partir dos resultados obtidos da amostra, deseja-se testar certos parâmetros da população ou mesmo testar a natureza da população.
tratamento: é o método ou a população cujo efeito deseja-se medir ou comparar em um experimento ou em um levantamento.
variância: é um momento de dispersão, calculado por um quo-ciente do somatório dos quadrados da diferença entre cada es-core e a respectiva média, e o denominador representado pelo número de graus de liberdade correspondente.
variável aleatória contínua: quando varia num conjunto infinito não enumerável.
variável aleatória discreta: quando assume somente um nú-mero finito de valores ou quando varia num conjunto infinito enu-merável.
variável aleatória “F” de snedecor: variável aleatória definida como a razão de duas variáveis independentes com distribuição qui-quadrado, com k graus de liberdade correspondente ao nu-merador e p graus de liberdade inerente ao denominador. Pos-suindo a sua função densidade denominada “F” de Snedecor.
variável de interesse: característica das unidades da popula-ção que se pretende conhecer.
variável aleatória qui-quadrado: variável aleatória com k graus de liberdade; é definida como a soma de k quadrados de nor-mais padronizadas e independentes. Possui a sua função densi-dade denominado de qui-quadrado.
434
variável aleatória “t” de student: variável aleatória com n-1, tamanho da amostra menos um, graus de liberdade. É definida como o quociente entre a diferença da média estimada e a mé-dia populacional pelo erro padrão. Possui a sua função densida-de denominada “t” de Student.
variável aleatória: é aquela que ocorre com certa probabilidade.
viés ou vício: de um estimador de um parâmetro é a diferença entre o seu valor esperado e o valor do parâmetro.
435
Anexo
tabela 1- áreas da distribuição normal padrão.
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
436
tabela 2 - Distribuição de 2c .
ak 0,995 0,990 0,975 0,95 0,90 0,75 0,50 0,50 0,10 0,05 0,025 0,01 0,005
1 0,000 0,0002 0,0010 0,0039 0,0158 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88
2 0,010 0,0001 0,0506 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,6
3 0,0717 0,115 0,216 0,352 0,584 1,021 2,37 4,11 6,25 7,81 9,25 11,3 12,8
4 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 11,1 13,3 14,9
5 0,412 0,554 0,831 1,15 1,61 2,67 4,35 6,63 9,24 11,1 12,8 15,1 16,7
6 0,676 0,872 1,24 1,64 2,20 3,45 5,35 7,84 10,6 12,6 14,4 16,8 18,5
7 0,989 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,0 14,1 16,0 18,5 20,3
8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,0
9 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6
10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 16,0 18,3 20,5 23,2 25,2
11 2,60 3,05 3,82 4,57 5,58 7,58 10,3 13,7 17,3 19,7 21,9 24,7 26,8
12 3,07 3,57 4,40 5,23 6,30 8,44 11,3 14,8 18,5 21,0 23,3 26,2 28,3
13 3,57 4,11 5,01 5,89 7,04 9,30 12,3 16,0 19,8 22,4 24,7 27,7 29,8
14 4,07 4,66 5,63 6,57 7,79 10,2 13,3 17,1 21,1 23,7 26,1 29,1 31,3
15 4,60 5,23 6,23 7,26 8,55 11,0 14,3 18,2 22,3 25,0 27,5 30,6 32,8
16 5,14 5,80 6,91 7,96 8,31 11,9 15,3 19,4 23,5 26,3 28,4 32,0 34,3
17 5,70 6,41 7,56 8,67 10,1 12,8 16,3 20,5 24,8 27,6 30,2 53,4 35,7
18 6,26 7,01 8,23 9,39 10,9 13,7 17,3 21,6 26,0 28,9 31,5 34,8 37,2
19 6,84 7,63 8,91 10,1 11,7 14,6 18,3 22,7 27,2 30,1 32,9 36,2 38,6
20 7,43 8,26 9,59 10,9 12,4 15,5 19,3 23,8 28,4 31,4 34,2 37,6 40,0
21 8,03 8,90 10,3 11,6 13,2 16,3 20,3 24,9 29,6 32,7 35,5 38,9 41,4
22 8,64 9,54 11,0 12,3 14,0 17,2 21,3 26,0 30,8 33,9 36,8 40,5 42,8
23 9,26 10,2 11,7 13,1 14,8 18,1 22,3 27,1 32,0 35,2 38,1 41,6 44,2
24 9,89 10,9 12,4 13,8 15,7 19,0 23,3 28,2 33,1 36,4 39,4 43,0 45,6
25 10,5 11,5 13,1 14,6 16,5 19,9 24,3 29,3 34,4 37,7 40,6 44,3 46,9
26 11,2 12,2 13,8 15,4 17,3 20,8 25,3 30,4 35,6 38,9 41,9 45,6 48,3
27 11,8 12,9 14,6 16,2 18,1 21,7 26,3 31,5 36,7 40,1 43,2 47,0 49,6
28 12,5 13,6 15,3 16,9 18,9 22,7 27,3 32,6 37,9 41,3 44,5 48,3 51,0
29 13,1 14,3 16,0 17,7 19,8 23,6 28,3 33,7 39,1 42,6 45,7 49,6 52,5
30 13,8 15,0 16,8 18,5 20,6 24,5 29,3 34,8 40,3 43,8 47,0 50,9 53,7
2,kac
437
tabela 3 - Distribuição “t” de Student.
ak 0,50 0,25 0,10 0,05 0,025 0,01 0,005
1 1,00000 2,4142 6,3138 12,706 25,542 63,657 127,32
2 0,81650 1,6036 2,9200 4,3127 6,2053 9,9248 14,089
3 0,76489 1,4226 2,3534 3,1825 4,1765 5,8409 7,4533
4 0,74070 1,3444 2,1318 2,7764 3,4954 4,6041 5,5976
5 0,72669 1,3009 2,0150 2,5706 3,1634 4,0321 4,7733
6 0,71756 1,2733 1,9432 2,4469 2,9687 3,7074 4,3168
7 0,71114 1,2543 1,8946 2,3646 2,8412 3,4995 4,0293
8 0,70639 1,2403 1,8595 2,3060 2,7515 3,3554 3,8325
9 0,70272 1,2297 1,8331 2,2622 2,6850 3,2498 3,6897
10 0,69981 1,2213 1,8125 2,2281 2,6338 3,1693 3,5814
11 0,69745 1,2145 1,7959 2,2010 2,5931 3,1058 3,4966
12 0,69548 1,2089 1,7823 2,1788 2,5600 3,9545 3,4284
13 0,69384 1,2041 1,7709 2,1604 2,5326 3,0123 3,3725
14 0,69200 1,2001 1,7613 2,1448 2,5096 5,9768 3,3257
15 0,69120 1,1967 1,7530 2,1315 2,4899 2,9467 3,2860
16 0,69013 1,1937 1,7459 2,1199 2,4729 2,9208 3,2520
17 0,68919 1,1910 1,7396 2,1098 2,4581 2,8982 3,2225
18 0,68837 1,1887 1,7341 2,1009 2,4450 2,8784 3,1966
19 0,68763 1,1866 1,7291 2,0930 2,4334 2,8609 3,1737
20 0,68696 1,1848 1,7247 2,0860 2,4231 2,8453 3,1534
21 0,68635 1,1831 1,7207 2,0796 2,4138 2,8314 3,1352
22 0,68580 1,1816 1,7171 2,0739 2,4055 2,8188 3,1188
23 0,68531 1,1802 1,7139 2,0687 2,3979 2,8073 3,1040
24 0,68485 1,1789 1,7109 2,0639 2,3910 2,7969 3,0905
25 0,68443 1,1777 1,7081 2,0595 2,3846 2,7874 3,0782
26 0,68405 1,1766 1,7056 2,0555 2,3788 2,7787 3,0669
27 0,68370 1,1757 1,7033 2,0518 2,3734 2,7707 3,0565
28 0,68335 1,1748 1,7011 2,0484 2,3685 2,7633 3,0469
29 0,68304 1,1739 1,6991 2,0452 2,3638 2,7564 3,0380
30 0,68276 1,1731 1,6973 2,0423 2,3596 2,7500 3,0298
40 0,68066 1,1673 1,6839 2,0211 2,3289 2,7045 2,9712
60 0,67862 1,1616 1,6707 2,0003 2,2991 2,6603 2,9146
120 0,67656 1,1559 1,6577 1,9799 2,2699 2,6174 2,8599
∞ 0,67449 1,1503 1,6449 1,9600 2,2414 2,5758 2,8070
438
tabela 4 - Distribuição “F” de Snedecor para a = 5%.
kp 1 2 3 4 5 6 7 8 9 10 20 30 120
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 248,0 250,1 253,32 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,45 19,46 19,493 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,66 8,62 8,554 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,80 5,75 5,665 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,56 4,50 4,406 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 3,87 3,81 3,707 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,44 3,38 3,278 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,15 3,08 2,979 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 2,94 2,86 2,7510 4,96 4,10 3,71 3,48 3,33 3,22 3,14 4,07 3,02 2,98 2,77 2,70 2,5811 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,65 2,57 2,4512 4,75 3,89 3,49 3,26 3,11 3,00 2,90 2,85 2,80 2,75 2,54 2,47 2,3413 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,46 2,38 2,2514 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,39 3,31 2,1815 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,33 2,25 2,1116 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,28 2,19 2,0617 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,23 2,15 2,0118 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,19 2,11 1,9719 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,16 2,07 1,9320 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,12 2,04 1,9021 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,10 2,01 1,8722 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,07 1,98 1,8423 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,05 1,96 1,8124 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,03 1,94 1,7930 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 1,93 1,84 1,6840 4,08 3,23 2,84 2,61 2,45 2,34 2,21 2,18 2,12 2,08 1,84 1,74 1,5860 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,75 1,65 1,47120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,66 1,55 1,35∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,57 1,46 1,22
a,, pkF
439
tabela 5 - Distribuição “F” de Snedecor para a = 1%.
kp 1 2 3 4 5 6 7 8 9 10 20 30 120
1 4052 4999 5403 5625 5764 5859 5928 5982 6022 6056 6209 6261 63392 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,45 99,47 99,493 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 26,69 26,50 26,224 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,02 13,84 13,565 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,55 9,38 9,116 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,40 7,23 6,977 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,16 5,99 5,748 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,36 5,20 4,959 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 4,81 4,65 4,40
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,41 4,25 4,0011 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,10 3,94 3,6912 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 3,86 3,70 3,4513 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,66 3,51 3,2514 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,51 3,35 3,0915 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,37 3,21 2,9616 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,26 3,10 2,8417 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,16 3,00 2,7518 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,08 2,92 2,6619 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,00 2,84 2,5820 8,10 5,35 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 2,94 2,78 2,5221 8,02 5,78 4,82 4,37 4,04 3,81 3,64 3,51 3,40 3,31 2,88 2,72 2,4622 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 2,78 2,67 2,4023 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 2,74 2,62 2,3524 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 2,70 2,58 2,3125 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,66 2,54 2,2726 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,63 2,50 2,2327 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,60 2,47 2,2028 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,57 2,44 2,1729 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,55 2,41 2,1430 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,37 2,39 2,1140 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,37 2,20 1,9260 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,20 2,03 1,73
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,03 1,86 1,53∞ 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 1,88 1,70 1,32
a,, pkF
440
tabela 6 - Valores críticos do teste de Hartley aos níveis de 1% e 5% de probabilidade.
g: número de gruposn1 = n-1 número de graus de liberdade de cada grupoa = 5%.
gn1
2 3 4 5 6 7 8 9 10 11 12
23456789
101215203060∞
39,0015,40
9,607,155,824,994,434,033,723,282,862,462,071,671,00
87,5027,8015,5010,80
8,386,946,005,344,854,163,542,952,401,851,00
142,0039,2020,6013,7010,40
8,447,186,315,674,794,013,292,611,961,00
202,0050,7025,2016,3012,10
9,708,127,116,345,304,373,542,782,041,00
266,0062,0029,5018,7013,7010,80
9,037,806,925,724,683,762,912,111,00
333,0072,9033,6020,8015,0011,80
9,788,417,426,094,953,943,022,171,00
403,0083,5037,5022,9016,3012,7010,508,957,876,425,194,103,122,221,00
475,0093,9041,1024,7017,5013,5011,109,458,286,725,404,243,212,261,00
550,00104,0044,6026,5018,6014,3011,709,918,667,005,594,373,292,301,00
626,00114,0048,0028,2019,7015,1012,2010,309,017,255,774,493,362,331,00
704,00124,0051,4029,9020,7015,8012,7010,709,347,485,934,593,392,361,00
a = 1% gn1
2 3 4 5 6 7 8 9 10 11 12
23456789101215203060∞
199,0047,5023,2014,9011,10
8,897,506,545,854,914,073,322,631,961,00
448,085,037,022,015,512,1
9,98,57,46,14,93,83,02,21,0
729,0120,0
49,028,019,114,511,7
9,98,66,95,54,33,32,31,0
1036,0151,0
59,033,022,016,513,211,1
9,67,66,04,63,42,41,0
1362,0184,0
69,038,025,018,414,512,110,4
8,26,44,93,62,41,0
1705,0216,079,042,027,020,015,813,111,18,76,75,13,72,51,0
2063,0249,089,046,030,022,016,913,911,89,17,15,33,82,51,0
2432,0281,097,050,032,023,017,914,712,49,57,35,53,92,61,0
2813,0310,0106,054,034,024,018,915,312,99,97,55,64,02,61,0
3204,0337,0113,057,036,026,019,816,013,410,27,85,84,12,71,0
3605,0361,0120,060,037,027,021,016,613,910,68,05,94,22,71,0
441
tabela 7 - Coeficientes para interpolação de polinômios ortogonais.
3 Ocasiões 4 Ocasiões 5 Ocasiões 6 Ocasiões10 20 10 20 30 10 20 30 40 10 20 30 40 50
-10
+1
+1-2
+1
-3-1
+1+3
+1-1-1
+1
-1+3-3
+1
-2-10
+1+2
+2-1-2-1
+1
-1+20-2
+1
+1-4
+6-4
+1
-5-3-1
+1+3+5
+5-1-4-4-1
+5
-5+7+4-4-7
+5
+1-3
+2+2-3
+1
-1+5-10
+10-5
+1
7 Ocasiões 8 Ocasiões 9 Ocasiões
10 20 30 40 50 10 20 30 40 50 10 20 30 40 50
-3-2-10
+1+2+3
+50-3-4-30
+5
-1+1+10-1-1
+1
+3-7
+1+6+1-7
+3
-1+4-50
+5-4
+1
-7-5-3-1
+1+3+5+7
+7+1-3-5-5-3
+1+7
-7+5+7+3-3-7-5
+7
+7-13-3
+9+9-3-13+7
-7+23-17-15
+15+17-23+7
-4-3-2-10
+1+2+3+4
+28+7-8-17-20-17-8
+7+28
-14+7+13+90-9-13-7
+14
+14-21-11+9+18+9-11-21
+14
-4+11
-4-90
+9+4-11+4
10 Ocasiões 11 Ocasiões
10 20 30 40 50 10 20 30 40 50
-9-7-5-3-1
+1+3+5+7+9
+6+2-1-3-4-4-3-1
+2+6
-42+14+35+31+12-12-31-35-14
+42
+18-22-17+3+18+18+3-17-22
+18
-6+14
-1-11-6
+6+11+1-14+6
-5-4-3-2-10
+1+2+3+4+5
+15+6-1-6-9-10-9-6-1
+6+15
-30+6+22+23+14
0-14-23-22-6
+30
+6-6-6-1
+4+6+4-1-6-6
+6
-3+6+1-4-40
+4+4-1-6
+3