AmostrAgem em InventárIo FlorestAl

AmostrAgem em InventárIo FlorestAl

Waldenei Travassos de Queiroz

BELÉM2012

mInIstérIo dA educAçãomInIstro: Fernando Haddad

unIversIdAde FederAl rurAl dA AmAzônIA reItor: Sueo Numazawa

vIce-reItor: Paulo de Jesus Santos

edItorAçãoMarly Maklouf dos Santos Sampaio

comIssão edItorIAlGracialda Costa Ferreira

Israel Hidenburgo Aniceto CintraMaria Cristina Manno

Moacir Cerqueira da SilvaSérgio Antonio Lopes de Gusmão

equIpe edItorIAlInácia Faro Libonati

Adriana AmaroRoseneli Lima

cApA

Waldenei Travassos de QueirozOberdan Müller Moraes das Flores

endereçoAv. Tancredo Neves, 2501, CEP: 66077-830- Montese

E-mail: [email protected]

Queiroz, Waldenei Travassos de Amostragem em inventário florestal / Waldenei

Travassos de Queiroz. -- Belém: Universidade Federal Rural da Amazônia, 2012.

441 p.: il. ISBN 978-85-7295-070-1

1. Inventário florestal. I. Título. CDD - 634.928

À Izabel, minha esposa.

Aos meus filhos Anderson e Alex,às minhas noras Lorena e Alessandra.

Aos meus pais Wagner e Erecina (in memoriam)

AgrAdecImentos

À Marly Maklouf dos Santos Sampaio, Editora Executiva da UFRA, pelo empenho na publicação deste livro, assim como à Sra. Inácia Faro Libonati e às Srtas. Adriana Amaro e Roseneli Lima pela cuidadosa revisão do texto final.

Ao Serviço Florestal Brasileiro, na pessoa do Engenheiro Florestal Joberto de Freitas Veloso, pelo convite para participar dos eventos que culminaram na construção do Projeto do Inventário Florestal Nacional do Brasil.

Agradecemos ao Professor Sylvio Péllico Netto da UFPR e aos professores da ESALQ/USP: Cassio Roberto de Melo Godoi, Humberto de Campos e Frederico Pimental Gomes (in memoriam), pelos conhecimentos que recebemos na área da teoria da amostragem, em nossa formação pós-graduada.

Somos gratos aos revisores deste trabalho: Ao Estatístico Edson Marcos Leal Soares Ramos, Doutor em Estatística e Professor da Faculdade de Estatística da Universidade Federal do Pará, e ao Engenheiro Florestal Fernando Cristóvam da Silva Jardim, Doutor em Ciências Florestais e Professor Associado da UFRA. Agradecemos aos Estatísticos: João Guimarães Pinheiro e Mário Diego Valente da Rocha, bem como ao Engenheiro Florestal Oberdan Müller Moraes das Flores, pelas sugestões e críticas; e a todos que nos incentivaram na tarefa de oferecer aos usuários da teoria da amostragem aplicada ao planejamento de inventários florestais uma obra que reúne algumas experiências condizentes, principalmente, com as condições impostas pelos tipos florestais ocorrentes no Brasil.

Agradecemos, de forma especial, ao Professor Lúcio Salgado Vieira (in memoriam), mestre na arte real que fundamenta

as bases das relações humanas, que pelos seus exemplos nos ensinou a descobrir os segredos da nossa missão de vida.

Se a matemática é o pincel com que Deus desenhou o universo, então, a estatística é a ferramenta humana criada para tentar entendê-lo!

Waldenei Travassos de Queiroz

sumárIo

preFácIo ..............................................................................13

ApresentAção ...................................................................15

cApítulo 1 - Introdução Ao InventárIoFlorestAl ..................................................................................17

cApítulo 2 - InventárIo e mAnejo FlorestAl ........23

cApítulo 3 - FundAmentos de estAtístIcA ..............293.1 DEFINIçõES.....................................................................313.2 PONTO AMOSTRAL E ESPAçO AMOSTRAL ..................313.3 VARIáVEL ALEATóRIA .....................................................323.4 ESPERANçA MATEMáTICA ............................................323.5 DISTRIBUIçãO DE PROBABILIDADE .............................333.5.1 Função de probabilidade de variáveis discretas.......333.5.2 Função densidade de probabilidade de variáveis contínuas .................................................343.5.3 Função de distribuição acumulada ou função de distribuição .................................................343.5.4 distribuição binomial ...................................................353.5.5 distribuição de poisson...............................................373.5.6 distribuição normal ......................................................393.5.7 distribuição de c2 .........................................................433.5.8 distribuição “t” de student ........................................463.5.9 distribuição “F” de snedecor .....................................50

cApítulo 4 - AmostrAgem sImples Ao AcAso .........534.1 VALORES POPULACIONAIS E ESTIMADORES .............574.2 AMOSTRAGEM SIMPLES AO ACASO PARA PROPORçõES E PORCENTAGENS ..............................71

4.2.1 valores populacionais, estimadores edimensionamento da amostra..............................................73

cApítulo 5 - AmostrAgem estrAtIFIcAdA ................795.1 VALORES POPULACIONAIS E ESTIMADORES POR ESTRATO .................................................................835.2 VALORES POPULACIONAIS E ESTIMADORES CONSIDERANDO TODOS OS ESTRATOS .....................875.3 PRECISãO DA AMOSTRA ESTRATIFICADA EM RELAçãO À AMOSTRA SIMPLES AO ACASO................955.4 INVENTáRIO FLORESTAL APRESENTANDO SUBPOPULAçõES COM DIFERENTES INTENSIDADES DE AMOSTRAGEM ............................. 112

cApítulo 6 - AmostrAgem sIstemátIcA .................. 1176.1 VARIâNCIA DA MÉDIA ....................................................1226.2 PRECISãO DA AMOSTRA SISTEMáTICA COMPARADA À AMOSTRA SIMPLES AO ACASO ........124

cApítulo 7 - estImAtIvAs por rAzão ........................1377.1 ESTIMATIVAS POR RAzãO COM IGUAL PROBABILIDADE .................................................1397.2 ESTIMATIVAS POR RAzãO CONSIDERANDO PROBABILIDADE PROPORCIONAL (AAP) À VARIáVEL AUxILIAR (x) .................................................1497.3 ESTIMATIVAS POR RAzãO: AMOSTRAGEM INVERSA COM PROBABILIDADE PROPORCIONAL À VARIáVEL AUxILIAR x (AIPP) ....................................1567.4 ESTIMATIVAS POR RAzãO CONSIDERANDO A AMOSTRAGEM ESTRATIFICADA .................................1577.5 DUPLA AMOSTRAGEM: FASES DEPENDENTES ........1707.6 COMPARAçãO DE DOIS íNDICES OU DUAS RAzõES ........................................................175

cApítulo 8 - estImAtIvAs por regressão .............1818.1 PARâMETROS POPULACIONAIS E ESTIMADORES ...1838.2 ESTIMATIVAS POR REGRESSãO CONSIDERANDO A AMOSTRA ESTRATIFICADA AO ACASO ....................202

cApítulo 9 - AmostrAgem por conglomerAdo....2319.1 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO ......................................................2359.1.1 parâmetros populacionais e estimadores ...............2359.2 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO COM UNIDADES DE GRANDEzAS DESIGUAIS..............................................2419.2.1 parâmetros populacionais e estimadores ...............2419.3 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO PELAS PROPORçõES......................2549.3.1 valores populacionais e estimadores ......................2559.4 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS ......................................................2619.4.1 componentes de variâncias no modelo inteiramente ao acaso ...............................................2619.4.2 parâmetros populacionais e estimadores ...............2679.4.3 ocorrência de estimativa negativa do componente de variância entre conglomerados ).(ˆ yVe ) ..................2809.5 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS COM GRANDEzAS DESIGUAIS .................2959.5.1 valores populacionais e estimadores ......................2959.6 CONGLOMERADOS EM DOIS ESTáGIOS: ANáLISE ESTATíSTICA CONSIDERANDO A OCORRêNCIA DE TIPOLOGIAS DIFERENTES NA SUBPARCELA ............3009.6.1 valores populacionais e estimadores ......................3019.7 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS: ANáLISE ESTATíSTICA CONSIDERANDO A OCORRêNCIA DE UMA VARIáVEL AUxILIAR ...........3059.7.1 valores populacionais e estimadores ......................306

9.8 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS PELAS PROPORçõES ................................3229.8.1 valores populacionais e estimadores ......................3229.9 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTáGIOS PELAS PROPORçõES COM GRANDEzAS DESIGUAIS (Mi ) .............................................................3269.9.1 valores populacionais e estimadores ......................3269.10 ESTRUTURAS DE CONGLOMERADOS EM INVENTáRIOS FLORESTAIS .......................................3299.11 AMOSTRAGEM POR CONGLOMERADOS EM TRêS ESTáGIOS ...........................................................3399.11.1 valores populacionais e estimadores.....................3419.11.2 parâmetros populacionais e seus estimadores através da análise de variância ...............................343

cApítulo 10 - InventárIo FlorestAl contínuo ...36310.1 MÉTODO DE ANáLISE DE PARCELAS SUBDIVIDIDAS ...36710.2 MODELO DE AMOSTRAGEM COM SUBSTITUIçãO PARCIAL ............................................38410.2.1 estimador Asp de xµ e sua variância )ˆ( xV µ ..........38510.2.2 estimador Asp de yµ e sua variância )ˆ( yV µ .........38910.2.3 covariância entre os estimadores Asp xµ e

yµ ...39010.2.4 estimador Asp de dµ e sua variância )ˆ( dV µ .........391

cApítulo 11 - FormA e tAmAnho dAsunIdAdes de AmostrA ...................................................40311.1 MÉTODOS PARA OBTER O TAMANHO IDEAL ...........408

consIderAções FInAIs ..................................................413

reFerêncIAs .....................................................................419

glossárIo .........................................................................425

Anexo ..................................................................................435

preFácIo

O livro Amostragem em Inventário Florestal foi elaborado para servir como um guia prático para profissionais e estudantes de graduação e pós-graduação que necessitam dos conhecimen-tos e da teoria de estatística. Sua forma de abordagem apresenta uma grande revisão dos conhecimentos básicos de probabilidade e estatística, podendo, desta forma, ser utilizado como texto em diversos cursos de graduação e pós-graduação, como por exem-plo, cursos de Engenharia Florestal, Agronomia e Estatística.

De fato, o livro serve como instrumento para o aprimora-mento das análises dos levantamentos florestais. Em seus ca-pítulos são abordadas as mais importantes técnicas de amos-tragem: Simples ao acaso, Estratificada, Sistemática e por Con-glomerados. Cursos de Amostragem são cada vez mais comuns em empresas e instituições de pesquisa. Assim, pensando na diversidade de aplicações dos conhecimentos advindos dessas técnicas, esta obra mostra-se como uma contribuição ao assun-to com a profundidade e o rigor técnico necessários.

Além disso, como o Inventário Nacional do Brasil come-çará a ser executado neste início de década, utilizando o proce-dimento por Conglomerados, a obra Amostragem em Inventá-rio Florestal configura-se como um importante suporte técnico àqueles que irão executar esta tarefa, pois é evidente que o In-ventário Nacional do Brasil não será tratado por meio de uma simples análise, visto a grande diversidade florística e extensão territorial brasileira. Desta forma, as técnicas abordadas no livro, como por exemplo, as análises associadas de estimativas por razão e por regressão, poderão ser melhores compreendidas.

A partir da experiência do autor em procedimentos envol-vendo a Amostragem em Inventário Florestal é possível ob-servar, no texto, a boa qualidade dos exemplos e dos exercícios resolvidos, além disso, o livro apresenta uma coleção de técni-cas e metodologias estatísticas reunidas numa só obra. Desta forma, professores, pesquisadores e usuários podem, então, a partir deste livro compreender e implementar cada uma das técnicas e ferramentas abordadas facilmente. Finalmente, esta obra pode ser destinada a todos aqueles que utilizam e estudam as técnicas de amostragem e seus benefícios nas diversas áre-as de conhecimento.

prof. dr. edson marcos leal soares ramos

ApresentAção

O objetivo deste livro é contribuir com conhecimentos no ensino de teoria de amostragem e no planejamento estatístico de inventários florestais. É importante que, além de servir como livro texto para os estudantes, seja também um instrumento para o aprimoramento das análises dos levantamentos florestais.

O Inventário Nacional do Brasil, que começará a ser execu-tado neste início de década, utilizará o processo de amostragem por conglomerados. É evidente que não se trata de uma análi-se simples, pois ocorrerão inúmeras situações a serem enfren-tadas, visto a grande diversidade florística, extensão territorial, entre outros. Assim sendo, análises associadas de estimativas por razão e por regressão podem ser empregadas quando os conglomerados possuírem tamanhos ou números diferentes de subparcelas.

O uso de variáveis auxiliares no processamento estatís-tico, além de permitir ganho de precisão, facilita a análise da variável resposta de interesse por tipologia florestal, onde a área de ocorrência da vegetação pode ser considerada como uma covariável.

A análise de dados proveniente do uso do processo de amostragem por conglomerados, por meio da subparcela, preci-sa ser mais discutida, visto a possibilidade da existência de de-pendência entre as subparcelas. Um procedimento alternativo é efetuar a análise considerando o conglomerado como uma uni-dade de observação, ou seja, obter as estimativas dos parâme-tros a partir da quantidade correspondente à soma dos valores observados nas subparcelas dentro de cada conglomerado.

Para os estudantes terem um melhor entendimento da

amostra por conglomerados, no sentido de aferir a sua eficácia, foi apresentada a dedução teórica do processo de obtenção dos componentes de variância entre os conglomerados e entre as subparcelas dentro de cada conglomerado.

Os componentes de variância são importantes no cálcu-lo do coeficiente de correlação intraconglomerado. Este coefi-ciente, além de medir o grau de dependência das subparcelas dentro dos conglomerados, avalia a precisão desse processo de amostragem em relação à amostra simples ao acaso. É mostra-do exercício sobre as diversas fórmulas do coeficiente de corre-lação e do cálculo dos componentes de variância, visando facili-tar as suas interpretações.

Do ponto de vista matemático, é indispensável ter algumas noções de álgebra linear e cálculo diferencial e o conhecimento de determinação de máximos e mínimos condicionados, usando, quando necessário, o método dos multiplicadores de Lagrange. Em relação à experiência em métodos estatísticos, o livro pressu-põe o conhecimento prévio de esperança matemática, de medi-das de tendência central, de medidas de dispersão e as distribui-ções: normal, “t” de Student, 2c , “F” de Snedecor, além de limites de confiança, regressão linear simples e análise de variância.

O autor, no sentido de buscar o aperfeiçoamento do livro “Amostragem em Inventário Florestal” e, assim, atender às de-mandas acadêmicas, coloca-se à disposição para o recebimen-to de críticas e sugestões.

cApítulo 1

Introdução Ao InventárIo FlorestAl

Define inventário florestal, mostrando a sua importância para a formulação de planos de utilização dos produtos flores-tais, manejo sustentado integrado da floresta, bem como para alicerçar propostas de planos de desenvolvimento e política flo-restal de caráter regional ou nacional. Apresenta um histórico resumido sobre o inventário florestal no Brasil, destacando a re-alização e os principais objetivos do Inventário Florestal Nacio-nal Brasileiro.

19

Introdução ao inventário florestal

Inventário florestal é o ramo da ciência florestal que visa avaliar as variáveis qualitativas e quantitativas da floresta e suas inter-relações, assim como dinâmicas de crescimento e suces-são florestal, servindo de base para a formulação de planos de utilização dos produtos florestais, manejo sustentado integrado da floresta, bem como para alicerçar propostas de planos de de-senvolvimento e política florestal de caráter regional ou nacional.

No sentido mais amplo, o inventário florestal pode, tam-bém, até ser planejado para avaliar outras funções da floresta como, por exemplo, as recreativas, a exploração de bacias hi-drográficas, da vida silvestre e outras possibilidades de uso do ecossistema florestal. Péllico Netto e Brena (1997) apresentam uma classificação dos inventários florestais em diversos tipos de acordo com seus objetivos, abrangência, forma de obtenção dos dados, abordagem da população no tempo e grau de deta-lhamento dos resultados.

O inventário florestal para fins de manejo florestal deve ser planejado tal que possa obter e interpretar os diversos pa-râmetros estruturais da floresta e suas inter-relações, objetivan-do subsidiar a definição dos tratamentos silviculturais e outras operações a serem executadas para obter a utilização ecológica e econômica, através da produção sustentável e contínua dos benefícios diretos e indiretos da floresta em prol da sociedade regional.

Na Amazônia brasileira, segundo SUDAM (1974), os pri-meiros trabalhos técnicos sobre inventário florestal tiveram início na década de 50 por meio dos levantamentos realizados pela missão FAO, que servia junto à Superintendência do Plano de Valorização Econômica da Amazônia - SPVEA, antecessora da atual Superintendência do Desenvolvimento da Amazônia - SU-DAM. Infelizmente, esses trabalhos não foram suficientemente

20

Amostragem em inventário florestal Waldenei Travassos de Queiroz

divulgados, e os artigos que chegaram a ser publicados foram em número reduzido de volumes e rapidamente esgotados.

Em termos de levantamentos de recursos naturais, no campo de inventário florestal de reconhecimento, a Amazônia ocupa uma posição relevante, visto os inúmeros programas exe-cutados na Amazônia brasileira, tendo-se entre os principais as pesquisas do Projeto RADAMBRASIL, os trabalhos desenvol-vidos pelo programa Polamazônia, os inventários executados para aprovação e instalação de projetos industriais, através da política de incentivos fiscais coordenada pela SUDAM, assim como os diversos levantamentos florestais realizados pelos ór-gãos públicos estaduais e federais.

Para Rollet e Queiroz (1978), os dois maiores inventários florestais de reconhecimento realizados na Amazônia brasileira são os da FAO (1956 – 1961) e os do Projeto RADAMBRASIL (1968 – 1977). O programa FAO foi dedicado, principalmente, ao estudo de uma região situada ao sul do rio Amazonas, entre os rios Madeira e Capim, em uma faixa de 150 km de largura por 1.500 km de comprimento, em direção oeste-leste, tendo sido estudadas 1.388 unidades de amostra de 1ha, abertura de 4.225 km de transectos, abrangendo a enumeração de 155.001 árvo-res, resultando em média 112 árvores por hectare, considerando os diâmetros à altura do peito (DAP) acima de 25 cm. O Proje-to RADAMBRASIL abrangeu toda a bacia amazônica brasileira com mais de 2.000 ha (amostra) levantados.

Nos anos de 1980 a 1982, no Brasil, foi realizado o inven-tário nacional dos reflorestamentos e nos anos de 1981 a 1984 o inventário das florestas naturais, mas não abrangendo a região Amazônica. Mais recentemente, os estados do Rio Grande do Sul, Minas Gerais e Santa Catarina realizaram os seus inventá-rios estaduais.

21

Introdução ao inventário florestal

O território brasileiro possui uma área aproximada de 526 milhões de hectares de florestas naturais, com ocorrência de 49% na Amazônia (350.861 km2), 10 % de Caatinga (52.269 km2), 24% de Cerrado (91.019 km2), 13% Mata Atlântica (30.167 km2), 2% Pantanal (2.679 km2), 2% Pampa (2.679 km2) e 6,6 milhões de florestas plantadas. O Brasil não pode prescindir de estabe-lecer um sistema de Inventário Florestal Nacional (IFN), visando estabelecer as condições técnicas e científicas necessárias para adoção de políticas públicas que resultem simultaneamente no desenvolvimento econômico, social e na conservação ambiental.

O Serviço Florestal Brasileiro (SFB) elaborou, com a partici-pação das comunidades técnicas, científicas em geral, o projeto do Inventário Florestal Nacional (IFN), o qual utilizará o processo de amostragem por conglomerado e deverá iniciar a sua opera-cionalização em 2011. E dentre os objetivos do IFN, destacam-se:

1) periodicamente, determinar e monitorar a cobertura flo-restal brasileira;

2) caracterizar e monitorar a diversidade da vegetação ar-bórea dos diferentes biomas brasileiros;

3) quantificar e qualificar os recursos madeiráveis, pros-pectar os recursos não madeiráveis e a qualidade dos ecossistemas por meio de indicadores;

4) determinar as mudanças da cobertura florestal ao longo do tempo;

5) gerar informações sobre o uso e importância da floresta para as populações de seu entorno;

6) gerar informações sobre áreas de preservação perma-nente e fragmentos de vegetação naturais;

7) gerar informações sobre uso e a conservação das flores-tas por meio de indicadores anuais;

22


8) fornecer informações periodicamente sobre as florestas brasileiras, agrupadas em diferentes unidades políticas, administrativas e de mapeamento, tais como: biomas, regiões fitoecológicas, Unidades da Federação e regi-ões geográficas, para subsidiar planos de desenvolvi-mento e de uso racional das florestas e seus serviços ambientais, bem como programas de revitalização de áreas degradadas e silvicultura com espécies nativas.

É importante frisar que os objetivos do IFN exigem a aplica-ção de modelagem estatística de larga amplitude metodológica e, na conjuntura atual de desenvolvimento do setor florestal bra-sileiro, é importante investir na formação de recursos humanos para a pesquisa, objetivando delinear sistemas de inventários flo-restais para apoiar as demandas do IFN e produzir delineamen-tos para alicerçar a elaboração de planos de manejo integrado de rendimento sustentável para os recursos florestais do país.

cApítulo 2

InventárIo e mAnejo FlorestAl

Mostra uma visão da aplicação do inventário florestal nas áreas de silvicultura e manejo florestal considerando a comple-xidade da diversidade florística das florestas tropicais amazôni-cas, bem como outros elementos importantes que fazem parte da estrutura de um inventário florestal direcionado à elaboração de planos de manejo para florestas naturais, assim como apre-senta alguns componentes que, obrigatoriamente, devem ser considerados no planejamento de inventários para atender tal fim.

25

Inventário e manejo florestal

Manejo florestal e Silvicultura são segmentos da ciência que estudam os princípios, técnicas e normas que visam organi-zar as ações necessárias para delinear e ordenar os fatores da produção florestal, maximizando a produtividade e a eficiência.

Produção contínua e sustentável também significa admitir que a floresta produz outros benefícios, além da madeira, depre-endendo-se que o manejo florestal deve ter como objetivo princi-pal o atendimento da demanda de madeira e de outros produtos e serviços florestais, maximizando a renda sem comprometer a cobertura florestal necessária à proteção dos solos, mananciais, biodiversidade e outras funções reguladoras da floresta.

Manejar significa administrar os recursos florestais, sendo necessário, para atingir uma boa administração, coletar, analisar e interpretar os diversos parâmetros dendrométricos, sociais, ecológicos e econômicos; estabelecer metas, programar ações e, assim, atingir os resultados esperados. Dessa forma, compete ao inventário florestal o suporte técnico e científico necessário ao silvicultor, para que sejam atingidos os objetivos propostos.

Por outro lado, deve-se considerar que, além da complexi-dade da diversidade florística das florestas tropicais amazônicas, existem outros elementos importantes que devem fazer parte da estrutura de um inventário florestal direcionado à elaboração de planos de manejo de florestas naturais. Alguns componentes que, obrigatoriamente, devem ser considerados no planejamen-to de inventários para atender tal fim, podem ser:

a) componentes ecológicos

Essas informações referem-se às associações inter e intra-específicas, que são as responsáveis pela dinâmica de cresci-mento e sucessão da floresta, as quais podem ser detectadas e

26


analisadas no inventário florestal através da análise dos vários índices de associações fitossociológicos existentes na literatura florestal. Esses índices são aqueles relacionados com a impor-tância ecológica das espécies na área em estudo.

A análise dos componentes ecológicos, atualmente nos in-ventários florestais regionais, basicamente é interpretada pelo índice do Valor de Importância das Espécies, o qual agrega os seguintes fatores:

a1) abundância por espécie: número de árvores amostrado por espécie dividido pelo número total de árvores ocor-rentes;

a2) frequência relativa: número de unidades de amostra que contém a espécie dividido pelo número total de uni-dades de amostra;

a3) dominância: a área basal de uma espécie dividida pela área basal da floresta amostrada;

b) componentes florísticos

Referem-se à composição botânica da área em estudo. O inventário florestal deverá ser dimensionado tal que assimile a ocorrência de todas as espécies existentes na área. As informa-ções sobre a composição florística, geralmente, são computa-das através da relação entre o número de espécies encontradas em função do tamanho da área amostral. O tamanho da amostra ideal a ser levantada no inventário florestal, para definir a estru-tura florística, deve ser aquele em que, aumentando-se a área amostrada, a probabilidade de ocorrer novas espécies é pratica-mente nula.

27

Inventário e manejo florestal

c) componentes dasométricos

São aqueles que explicam as relações existentes entre as diversas variáveis dendrométricas das quais, através da teoria de regressão, são obtidas diversas equações, principalmente as específicas para cubagem das árvores; relações hipsométricas e distribuições diamétricas.

d) componentes de estocagem

Os inventários florestais, em função da estrutura diamé-trica, estimam a existência de estocagem suficiente de mudas, varas e arvoretas das espécies. Essas informações visam veri-ficar se, com a retirada de árvores com dimensões comerciais, o estoque de árvores com dimensões menores será suficien-te para garantir a perpetuação das espécies em quantidade e qualidade. A distribuição diamétrica por espécie fornecerá essas informações.

Dizem respeito também à determinação da estocagem de árvores porta-sementes na floresta, para que no projeto de ma-nejo florestal, haja a possibilidade de definir as árvores que de-verão permanecer na área, de modo a garantir a perpetuação de espécies de interesse.

e) componentes qualitativos

Caracterizam a configuração qualitativa dos fustes das ár-vores com relação à sua forma, aspecto de tortuosidade e sani-dade, entre outras.

cApítulo 3

FundAmentos de estAtístIcA

Contempla definições, conceitos e aplicações práticas im-portantes no campo da estatística visando dar suporte ao enten-dimento da teoria de amostragem. Aborda os seguintes temas: ponto amostral e espaço amostral; variáveis aleatórias discretas e contínuas; esperança matemática; função de probabilidade de variáveis discretas e contínuas. Apresenta as distribuições: bino-mial, Poisson, normal, c2, “t” de Student e “F” de Snedecor.

31

Fundamentos de estatística

3.1 DEFINIçõES

Estatística é a matemática aplicada que estuda dados ori-ginados de observações.

A Estatística estuda métodos científicos para o planeja-mento de coleta, organização, resumo, apresentação e análise de dados, gerando conclusões para subsidiar a tomada de de-cisões.

A parte da Estatística referente à coleta, organização, re-sumo e apresentação de dados é conhecida como Estatística Descritiva ou Estatística Dedutiva.

A parte referente à análise e conclusão de dados denomi-na-se Inferência Estatística ou Estatística Indutiva.

3.2 PONTO AMOSTRAL E ESPAçO AMOSTRAL

Em qualquer experimento, cada acontecimento que possa ocorrer é denominado ponto amostral. A totalidade dos pontos amostrais constitui o espaço amostral ou universo. Sejam os se-guintes exemplos:

a) semeadas 100 sementes para verificar a percentagem de germinação, têm-se 101 pontos amostrais, consti-tuindo o espaço amostral;

b) a produção de madeira de uma floresta está entre 100 m3/ ha e 200 m3/ ha, assim, diz-se que o espaço amos-tral é constituído por infinitos pontos contidos no interva-lo [100 a 200].

Os espaços amostrais podem ser classificados em discre-tos e contínuos. O espaço amostral é discreto quando é consti-tuído por um número finito de pontos ou por um número infinito

32


desde que enumeráveis. O espaço amostral é contínuo quando é constituído por um conjunto infinito contínuo de pontos amos-trais.

3.3 VARIáVEL ALEATóRIA

Uma variável, definida como o símbolo representativo dos elementos de um conjunto, é dita aleatória quando associada a uma probabilidade de ocorrência. A variável aleatória pode ser classificada em discreta e contínua. A variável é discreta quando assume somente um número finito de valores ou quando varia num conjunto infinito enumerável. A variável é contínua quando assume valores que variam de acordo com um conjunto infinito não enumerável (intervalo contínuo).

3.4 ESPERANçA MATEMáTICA

Seja y uma variável aleatória discreta, assumindo os va-lores y1, y2,..., yn com as probabilidades p1, p2,..., pn, respectiva-mente. Define-se esperança matemática ou valor médio de y, como sendo:

∑=

=n

iii pyyE

1

)( para ∑=

=n

iip

1

1

Para as variáveis aleatórias contínuas, tem-se:

∫∞

∞−

= dyyfyyE )()( y f (y) dy dado que ∫

∞

∞−

=1dPdP = 1. Sendo f(y) a função

densidade.

Propriedades da esperança matemática:

E(c) = c, sendo c uma constante;

33


E(cy) = c E(y); E(x + y) = E(x) + E(y); E(xy) = [E(x)][E(y)], se x e y forem independentes.

Definições de variância e de covariância.V(y) = E[y - E(y)]2; V(ay) = c2 V(y);Cov(x,y) = E{[(x - E(x)][(y - E(y)]}= E(xy) – [E(x)][E(y)], sen-

do Cov(x,y) = 0, então x e y são independentes;V(x+y) = V(x) + V(y) + 2 Cov(x,y);V(x-y) = V(x) + V(y) - 2 Cov(x,y);V(ax+by) = a2V(x) + b2V(y) + 2ab Cov(x,y), dado que a e b

são constantes;V(ax-by) = a2V(x) + b2V(y) – 2ab Cov(x,y).

3.5 DISTRIBUIçãO DE PROBABILIDADE

Denomina-se distribuição de probabilidade ao conjunto de duas variáveis: uma, é a própria variável aleatória, e a outra, as suas respectivas probabilidades de ocorrência. De conformida-de com a natureza da variável aleatória, a distribuição pode ser classificada em discreta ou contínua.

3.5.1 Função de probabilidade de variáveis discretas

Para as variáveis aleatórias discretas, uma função f(y) é de probabilidade, se:

a) f(y) 0 para qualquer y;

b) .1)(∑ =y

yf

34


3.5.2 Função densidade de probabilidade de variáveis con-tínuas

Para as variáveis aleatórias contínuas, uma função f(y) é de densidade, se:

a) f (y) 0 para qualquer y real;

b) ∫∞

∞−

= dyyfyyE )()( y f (y) dy = ∫

∞

∞−

=1dPdP = 1

O termo f (y) dy representa a probabilidade de ocorrência de valores entre y e y + dy, denominado diferencial de probabi-lidade (dP).

3.5.3 Função de distribuição acumulada ou função de distri-buição

A função de distribuição acumulada é obtida a partir da f(y), que é representada, para um determinado valor de Y, pela fun-ção f(y) = P(y Y). Assim, têm-se:

a) para variáveis discretas ;)()( ∑≤

=Yy

yfyF

b) para variáveis contínuas .)()( ∫∞−

=y

dyyfyF f (y) dy.

Toda distribuição é definida através de uma função de pro-babilidade se a variável é discreta, ou por uma função de densi-dade se a variável é contínua.

35


3.5.4 distribuição binomial

É uma distribuição discreta, cuja função de probabilidade é:yny

y

nqpCyf −=)( , sendo:

p = probabilidade de realização do acontecimento favorável;q = probabilidade de realização do acontecimento contrário;y = número de vezes que se realiza o acontecimento favo-

rável;n = número de tentativas;

=y

nC número de combinações de n elementos, tomados y a y.

exercício 3.1

Em uma amostra de cinco árvores (n = 5) verificou-se a ocorrência de duas árvores (y = 2) com qualidade de fuste tipo 1 (fuste reto, cilíndrico, bem configurado e sem deterioração apa-rente). A aplicação de um teste de aderência comprovou que a variável “número de árvores” com qualidade de fuste tipo 1 segue a distribuição binomial. Obter as probabilidades de ocor-rência para y = 0, 1, 2, 3, 4, 5.

Dado que 5

2==

n

yp , então

5

31 =−= pq

a) se ynyy

nqpCyf −=)( , então a probabilidade de não ocor-

rer árvores com qualidade de fuste tipo 1 é obtida por:

0778,03125

243)

5

3()

5

2()0( 500

5 === Cf

Conclui-se que a probabilidade de não ocorrer árvores com qualidade de fuste tipo 1 é igual a 7,78%.

36


b) a probabilidade de ocorrer apenas uma árvore com qua-lidade de fuste tipo 1 é obtida por:

2592,03125

810)

5

3()

5

2()1( 411

5 === Cf

Conclui-se que a probabilidade de ocorrer uma árvore ape-nas com qualidade de fuste tipo 1 é igual a 25,92%.

c) a probabilidade de ocorrer duas árvores com qualidade de fuste tipo 1 é dada por:

3456,03125

1080)

5

3()

5

2()2( 322

5 === Cf

Conclui-se que a probabilidade de ocorrer duas árvores com qualidade de fuste tipo 1 é igual a 34,56%.

d) a probabilidade de ocorrer três árvores com qualidade de fuste tipo 1 é dada por:

2304,03125

720)

5

3()

5

2()3( 233

5 === Cf

Conclui-se que a probabilidade de ocorrer três árvores com qualidade de fuste tipo 1 é igual a 23,04%.

e) a probabilidade de ocorrer quatro árvores com qualidade de fuste tipo 1 é dada por:

0768,03125

240)

5

3()

5

2()4( 144

5 === Cf

Conclui-se que a probabilidade de ocorrer quatro árvores com qualidade de fuste tipo 1 é igual a 7,68%.

37


f) a probabilidade de ocorrer cinco árvores com qualidade de fuste tipo 1 é dada por:

0102,03125

32)

5

3()

5

2()5(

055

5 �� Cf

Conclui-se que a probabilidade de ocorrer cinco árvores com qualidade de fuste tipo 1 é igual a 1,02 %.

Note-se que:

∑=

−=+n

i

inini qpCqp

0

5 )()()(

Verificação:

10102,00768,02304,03456,02592,00778,0)5()4()3()2()1()0( =+++++=+++++ ffffff

3.5.5 distribuição de poisson

É uma distribuição discreta cuja função de probabilidade é:

!)(

y

mexf

ym−

=

Tal que y pode assumir valores y = 1,...,∞.

y = número de vezes que se realiza o acontecimento;m = média de ocorrência;e = base do logaritmo natural ou neperiano.

exercício 3.2

Usando-se parcelas de tamanho igual a 0,25 ha em um in-ventário florestal verificou-se, em média, 20 árvores, considerando

38


todas as espécies. A pesquisa cita que a probabilidade de ocorrer uma árvore da família meliaceae é 10%. Um teste de aderência comprovou que a variável resposta número de árvores ocorrentes dessa família segue a distribuição de Poisson. Calcular as proba-bilidades de ocorrência de: nenhuma árvore, apenas uma árvore, três árvores e cinco árvores da família meliaceae.

Dado que: !

)(y

mexf

ym−

= e m = p = 0,10 x 20 = 2

a) a probabilidade de ocorrer nenhuma árvore da família meliaceae é dada por:

1353,01

!0

2)0(

2

02

==×

=−

e

ef

Conclui-se que a probabilidade de ocorrer nenhuma árvore da família meliaceae é de 13,53%.

b) a probabilidade de ocorrer apenas uma árvore da família meliaceae é dada por:

2707,02

!1

2)1(

2

12

==×

=−

e

ef

Conclui-se que a probabilidade de ocorrer apenas uma ár-vore da família meliaceae é de 27,07%.

c) a probabilidade de ocorrer três árvores da família melia-ceae é dada por:

1804,06

8

!3

2)3(

2

32

==×

=−

e

ef

39


A probabilidade de ocorrer três árvores da família meliace-ae é de 18,04%.

d) a probabilidade de ocorrer cinco árvores da família me-liaceae é dada por:

0361,0120

32

!5

2)5(

2

52

==×

=−

e

ef

A probabilidade de ocorrer cinco árvores da família melia-ceae é de 3,61%.

3.5.6 distribuição normal

Quando os valores das observações de uma variável res-posta, originados de uma amostra, são agrupados em tabelas de frequências, objetiva-se conhecer a variação e como se pro-cessa a distribuição dos dados.

Existem inúmeros tipos de curvas que podem representar as distribuições. Na maioria das pesquisas biológicas, as observa-ções variam em torno da distribuição normal, a qual é uma distri-buição contínua, também conhecida como distribuição de Gauss, Laplace ou Laplace-Gauss. É a mais importante distribuição no campo da Estatística e tem a seguinte função de densidade:

2])(

[2

1

2)(

1)( yS

Yy

eyS

yf−

−

=p

(3.1)

Sendo:)()( yVyS = é o desvio padrão da distribuição;

e = base do logaritmo neperiano (e = 2,7183);p = constante geométrica (p = 3,1416).A notação usada é )](,[ yVYN )], lê-se que a variável aleató-

32

40


ria contínua y tem distribuição normal com média Y e variância V(y).

A equação normal tem como representação gráfica uma curva unimodal em forma de sino, contínua, simétrica em rela-ção à origem, onde os valores da variável resposta variam de - )( ∞<<−∞ y a + )( ∞<<−∞ y , possuindo um ponto de máxima frequência. A Figura 3.1 apresenta três formas gráficas de distribuições normais apre-sentando variâncias diferentes, tal que: )()()( 321 yVyVyV << .

Figura 3.1 - Formas gráficas da distribuição normal ( )( ∞<<−∞ y < y < )( ∞<<−∞ y ).

Para determinar a área compreendida pela curva e duas ordenadas quaisquer, integra-se a equação da curva entre as ordenadas. A integração da equação normal entre - )( ∞<<−∞ y e + )( ∞<<−∞ y im-plicará na obtenção da frequência total ou probabilidade integral, igual à unidade, abrangendo a área que fica sob a curva.

∫∞

∞−

=1)( dyyf f (y) dy = 1

Por outro lado, em relação ao cálculo das probabilidades, no que concerne à integração de f(y), apresentada na forma analítica da Equação 3.1, resultam dois problemas:

41


1) Para o cálculo da integral de f(y) é necessário o desen-volvimento em séries.

2) A elaboração de tabelas de probabilidade torna-se com-plicada, pois f(y) depende de dois parâmetros: Y e )(yV , acar-retando a necessidade de obter uma tabela para cada combina-ção de Y e )(yV .

Esses problemas são solucionados através de uma trans-formação de variável, surgindo, assim, a distribuição normal pa-dronizada ou reduzida de média zero e variância igual à unidade:

)()( ySYyz −=Na construção da variável z, y é uma variável normal de

média Y e variância )(yV . A variável aleatória contínua z tem distribuição normal, denominada de padronizada ou reduzida de média zero e variância igual a 1, pois:

0][)( )( == −

ySYyEzE e 1][)( )( == −

ySYyVyV

Então, a função densidade será:

221

21)( zezf −=p , onde - )( ∞<<−∞ y < z < + )( ∞<<−∞ y

As probabilidades estão apresentadas na Tabela 1 do Anexo.A distribuição normal apresenta as seguintes propriedades:a) a função f(y) é simétrica em relação à origem y = Y ou a

função f(z) é simétrica em relação à origem z = 0;b) a função f(y) possui um ponto de máximo em y = Y com

ordenada igual a 0,3989/S(y) ou a função f(z) possui um ponto de máximo no ponto z = 0 com ordenada 3989,021 =p ;

c) a função f(y) tende a zero quando y tende para ± )( ∞<<−∞ y ou f(z) tende a zero quando z tende para ± )( ∞<<−∞ y ;

d) a função f(y) tem dois pontos de inflexão cujas abscissas

42


valem Y + S(y) e Y - S(y), e as ordenadas são iguais a 0,24/S(y). A função f(z) tem dois pontos de inflexão cujas abscissas valem + 1 e – 1, e as ordenadas valem 0,24.

Mood, Graybill e Boes (1964) apresentam informações mais detalhadas sobre a teoria e as aplicações acerca das di-versas funções de probabilidade.

exercício 3.3

Seja um viveiro com 1.000.000 de mudas de uma deter-minada espécie florestal e que um empresário florestal deseja adquirir plantas com alturas no intervalo de 15 cm altura 27 cm. Suponha a medição de uma amostra selecionada de forma inteiramente ao acaso de 1000 plantas. O resultado de um tes-te estatístico de aderência comprovou que a variável resposta altura (y) distribui-se normalmente com média Y = 20 cm e V(y) = 25 cm2. Calcular o número de plantas esperado que atenda o intervalo estipulado pelo empresário cliente.

00,15

2015

)(1 ��

�

�

�

�

yS

YyZ

i

4,15

2027

)(2 �

�

�

�

�

yS

YyZ

j

Consultando a Tabela 1 do anexo, tem-se:

�

�

�0

00,1

3413,0)( dzzf e � �40,1

0

4192,0)( dzzf

� � ��

��40,1

00,1

0

00,1

40,1

0

7605,04192,03413,0)()()( dzzfdzzfdzzf

43


Conclui-se que a probabilidade de ocorrência de plantas no intervalo de 15 cm altura 27 cm é de 76,05 %. Então, o empresário florestal deve esperar, no intervalo estipulado, apro-ximadamente a disponibilidade de 760.500 plantas no viveiro.

3.5.7 distribuição de c2

A variável aleatória c2, denominada qui-quadrado com k graus de liberdade, é definida como a soma de k quadrados de normais padronizadas e independentes.

Então, ∑ ∑= =

−==

k

i

k

i

ii yS

Yyz

1 1

222 ])(

[c , para )1,0(Nz = .

A função densidade da variável c2 é dada pela Expressão 3.2. As probabilidades estão apresentadas na Tabela 2 do Ane-xo.

221

22)()1(2

2

2 )()2

1(

)(

1)(

ccc −−

Γ= ef

kk

k (3.2)

A função do tipo )2(kΓ é denominada de função gama e foi introduzida pelo matemático Leonardo Euler. Analiticamente é definida pela Fórmula:

∫∞

−=+Γ0

)1( dyeya ya dy

Demonstra-se que essa integral converge para 11 >+a . Informações teóricas e aplicações ver em Gomes e Nogueira (1980) e Piskounov (1978).

A distribuição c2 tem diversas e importantes aplicações, destacando-se entre elas as seguintes:

a) a distribuição c2 é utilizada como teste de aderência,

44


verificando se as distribuições empíricas, obtidas por meio dos dados amostrais, ajustam-se aproximadamente às distribuições teóricas;

b) outra aplicação importante é verificar a medida de dis-crepância entre as frequências observadas e as esperadas, ou seja, o objetivo é verificar se as frequências observadas diferem significativamente das esperadas. A estatística utilizada para ve-rificar essas hipóteses é:

;)(

1

2

2 ��

��

k

i i

ii

pfe

fefo�

c) verificar a hipótese )()()(: 210 yVyVyVH k=== L , que significa testar se existe igualdade de variâncias. De acordo com Steel e Torrie (1960), referida hipótese pode ser verificada pelo teste de Bartlett, por meio da estatística:

� ��

��k

i

k

i

iiip yVnyVn1 1

1010

2 )}(ˆlog)1()](ˆlog)1({[3026,2�

)(ˆ yV = variância amostral

)(ˆ yV = variância amostral média (∑

∑

=

==k

ii

k

iii

n

yVnyV

1

1

)(ˆ

)(ˆ );

d) verificar a hipótese )()(: 00 yVyVH = que significa testar a igualdade da variância populacional quando comparada com um valor padrão )(0 yV .

De acordo com Fonseca e Martins (1982), essa hipótese pode ser testada através do teorema de Fisher:

)(

)(ˆ)1(

0

2

yV

yVnp

−=c

45


Sendo n o tamanho da amostra; )(0 yV é o valor sob a hipó-tese nula; )(ˆ yV é a variância amostral;

e) obtenção do intervalo de confiança para a variância ver-dadeira de uma população normal. Se a variável y tem distri-buição normal com média Y e variância V(y), tem-se que, pelo teorema de Fisher, o intervalo de confiança para V(y) é:

acc

−=−

≤≤−

1))(ˆ)1(

)()(ˆ)1(

(2inf

2sup

yVnyV

yVnP .

O número de graus de liberdade a ser utilizado, neste caso, para obter o valor crítico é p = n-1.

Quando se utiliza a distribuição de 2pc para obter o número

de graus de liberdade (p), e assim ter os valores críticos para os diversos testes, considera-se as seguintes regras de decisão:

i) usar p = k-1, se as frequências esperadas no experimen-to são obtidas sem efetuar estimativas de parâmetros populacio-nais a partir de estatísticas amostrais;

ii) usar p=k-1-m, se as frequências esperadas são obtidas a partir da estimação de m parâmetros.

exercício 3.4

Um empresário do setor florestal está interessado em im-plantar em sua área uma indústria madeireira baseada no bene-ficiamento de apenas seis espécies. As informações disponíveis nos levantamentos realizados na região amazônica, pelas insti-tuições de pesquisa, indicam que as porcentagens de ocorrên-cias dessas espécies atendem às necessidades do projeto. O empresário, para obter as frequências observadas, efetuou na área um levantamento correspondente a 100.000 árvores. Con-siderando um nível de significância de a = 0,05, pergunta-se:

46


as frequências observadas divergem das esperadas? A Tabela 3.1 apresenta os dados sobre as frequências esperadas e as observadas.

tabela 3.1 - Frequências esperadas (fei) e frequências observadas (foi).

Espécies Porcentagem de ocorrência (Amazônia) (pi)

fei = pi x 100.000 (árvores) foi (árvores)

123456

2,52,01,81,51,10,8

25002000180015001100800

25361950179015801080820

800

)800820(

1100

)11001080(

1500

)15001580(

1800

)18001790(

2000

)20001950(

2500

)25002536( 22222225

−+

−+

−+

−+

−+

−=c

x52 = 6,95

Conclui-se pela não rejeição da hipótese da nulidade, visto que o valor calculado (x5

2 = 6,94) é menor que o valor tabelar (x5

2 = 11,1), obtido na Tabela 2 do Anexo para a = 0,05. Pode-se, então, afirmar que a ocorrência das espécies na área do empre-sário é semelhante à ocorrência na região amazônica.

3.5.8 distribuição “t” de student

Seja a variável aleatória:

n

ysYy

t)(

−=

Esta variável é conhecida como distribuição “t” de Student, com k = n-1 graus de liberdade, podendo também ser escrita na forma:

47


1

)1,0(2

1

−

=−

n

Nt

nc

s (y) é o desvio padrão estimado.

O gráfico da função densidade da variável “t” de Student é simétrico e tem uma forma parecida com a da distribuição nor-mal, entretanto, menos achatada, com média zero e variância igual a )2( −kk , em que k > 2 (graus de liberdade). A função densidade da variável “t” é dada pela Expressão 3.3. As probabi-lidades estão apresentadas na Tabela 3 do Anexo.

2

12

1

2

21

)k(

)k

t(

k).k

(

)k

()t(f

+−

+pΓ

+Γ

= , onde - )( ∞<<−∞ y < t < )( ∞<<−∞ y (3.3)

A distribuição “t” de Student possui importantes aplicações, destacando-se entre elas as seguintes:

a) testa a hipótese 00 : YYH = . Verifica se há igualdade en-tre o valor médio de uma população versus um valor padrão, sendo essa hipótese testada através da estatística:

n

ysYy

t)(0−

= , que sob 0H apresenta n-1 graus de liberdade;

b) testa a hipótese 210 : YYH = . Verifica se há igualdade en-tre os valores médios de duas populações independentes, sen-do testada através da estatística:

)

11)((ˆ

21

21

nnyV

yyt

�

�

� , tal que: 2

)(ˆ)1()(ˆ)1()(ˆ

21

2211

−+−+−

=nn

yVnyVnyV

48


Com 221 −+ nn graus de liberdade sob 0H , sendo )(ˆ yV a variância comum;

c) testa a hipótese 210 : YYH = . Verifica se há igualdade en-tre os valores médios de duas populações dependentes (teste “t” pareado), sendo testada por meio da estatística:

n

ysyy

td )(

21 −= , com n-1 graus de liberdade sob 0H .

Sendo: ,)(ˆ)( dVysd = tal que:

1

)(

)(ˆ

2

1

1

2

−

−=

∑∑ =

=

nn

dd

dV

n

iin

ii

, para iii yyd 21 −= .

Desde que a variável resposta seja normal, a distribuição “t” de Student é muito importante em termos de inventários flo-restais, pois permite obter os intervalos de confiança para os valores médio e total para os produtos florestais de uma popula-ção. É aplicada também para dimensionar o tamanho da amos-tra quando fixada à precisão. Informações mais detalhadas so-bre esses aspectos serão vistas quando da apresentação dos processos de amostragem nos capítulos seguintes.

exercício 3.5

Estudos científicos indicam que uma determinada espécie florestal com excelentes características tecnológicas, em uma determinada região tropical úmida em outro país, produz no fim de sua rotação, aos sete anos, um volume de madeira em tor-

49


no de 100 m3/ha. Um empresário brasileiro tem interesse em introduzir a referida espécie para verificar se o comportamento é o mesmo em sua propriedade, e, para atingir seu objetivo, re-alizou um experimento com 20 unidades de amostra de 0,1 ha. A Tabela 3.2 apresenta os volumes medidos após sete anos da implantação do experimento.

tabela 3.2 - Volumes (m3) de madeira por unidade de 0,1 ha.

UA yi UA yi UA yi UA yi

12345

8,510,39,87,8

11,0

6789

10

9,610,98,99,8

11,5

1112131415

7,912 8,89,5

10,8

1617181820

8,88,7

12,37,78,9

A hipótese a ser formulada para atender o objetivo do em-presário é a seguinte: 00 : YYH = . A hipótese a ser testada é

hamYH /100: 30 = ha, e o teste deverá ser realizado por meio da

estatística:

n

ysYy

t)(0−

=

Sejam os valores estimados para a média e para a variância:

hamy 1,0/675,9 3�

hamy /75,96675,910 3��

9072,1)(ˆ�yV 3

/( 0,1ha)m

232)/(7237,1909072,110)(ˆ hamyV ��

hamys /8103,13)(3

�

2

50


Então:

0524,10881,3

25,3

20

8103,13

10075,96��

�

�

�

�t

Dado que t19;0,05 = 2,0930, não há razão para rejeitar H0. Conclui-se, então, que o comportamento da espécie confirmou as informações oriundas das pesquisas, ou seja, o empresário pode esperar, com uma probabilidade de acerto de 95% que, se a espécie for plantada em sua propriedade, a mesma deverá pro-duzir em média um volume de 100 m3 de madeira por hectare.

3.5.9 distribuição “F” de snedecor

A estatística “F de Snedecor” é definida como a razão de duas variáveis independentes com distribuição 2c , ou seja:

p

kF

p

kpk 2

2

),( cc

=

O valor k é o número de graus de liberdade do numerador e p é o número de graus de liberdade do denominador. A função densidade da distribuição F de Snedecor é dada pela Equação 3.4. As probabilidades estão apresentadas nas Tabelas 4 e 5 do Anexo.

)(}

])(1[

{)(

)2

()2

(

]2/)[()( ),0(

)2

(

)2

2(

2 FI

Fp

k

F

p

k

pk

pkFf

pk

k

k

��

�

��

�� (3.4)

A distribuição F de Snedecor possui diversas aplicações no campo da estatística, entre elas destacam-se as seguintes:

a) testar a hipótese H0 : Ve (y) = 0 . Verificar se o componen-

51


te de variância entre populações é igual a zero. Esta hipótese é muito utilizada na genética e, em termos de inventário florestal, pode ser utilizada para testar se o componente de variância en-tre os conglomerados é igual a zero. Este problema será visto com mais detalhes no capítulo sobre a Amostragem por Conglo-merados;

b) testar a hipótese H0 : t1 = t2 = • • • = tk = o . Verificar se os efeitos de k tratamentos são todos iguais a zero. O modelo ma-temático considera que os efeitos, devidos aos tratamentos, são fixos. A hipótese da nulidade H0 : t1 = t2 = • • • = tk = 0 é similar à hipótese kYYYH === L210 : ;

c) testar a hipótese H0 : V1(y) = V2(y). Verificar se há igual-dade entre duas variâncias, sendo testada através da estatística:

)(ˆ)(ˆ21 yVyVF =

Que sob H0 possui n1 - 1 graus de liberdade no numerador e n2 - 1 graus de liberdade no denominador.

É importante observar que a hipótese H0 : V1(y) = V2(y) = • • • = Vk(y) pode ser verificada pelo teste de Hartley ou teste da Razão Máxi-ma Hc . Ver a Tabela 6 do Anexo que, segundo Banzato e Kronka (1989), é específica para esse teste.

)(ˆ)(ˆ

min yV

yVH máx

c = , tal que:

)(ˆmax yV = maior variância

minV = menor variância

52


exercício 3.6

Seja um inventário florestal realizado através de uma amos-tra estratificada apresentando três estratos. A Tabela 3.3 mostra os dados de volumes de madeira de 39 parcelas de superfície de 0,25 ha, tendo a seguinte alocação por estrato: estrato 1 = 13 parcelas, estrato 2 = 15 parcelas e estrato 3 = 11 parcelas. Pede-se: testar a hipótese 3210 : YYYH == , que significa verificar se todas as médias são iguais. A Tabela 3.4 apresenta a análise de variância dos dados.

tabela 3.3 - Volumes (m3) por parcela de 0,25 ha.

ESTRATO I ESTRATO II ESTRATO III

21,1034,0018,0020,0055,0023,4240,5017,44

22,1225,0031,2017,0524,10

12,9017,009,50

20,0030,1023,4221,1017,44

22,1212,0016,5017,0524,1016,7121,80

8,1012,009,50

14,5018,1721,1010,807,50

6,5012,505,20

tabela 3.4 - Análise de variância para os três estratos.

Fontes de variação GL SQ QM F

Entre estratosDentro dos estratos

236

1421,96212069,6326

710,981157,4898

12,37**

Total 38 3491,5947

Sendo o valor de F calculado (12,37) maior que o valor tabelar (F2;36;0,01), conclui-se pela rejeição de 3210 : YYYH == , ou seja, existe pelo menos um contraste significativo entre as mé-dias. Caso haja necessidade em testar contrastes de interesse entre os valores médios dos estratos, é recomendável aplicar testes de comparações múltiplas.

cApítulo 4

AmostrAgem sImples Ao AcAso

Do ponto de vista estatístico define população e, para fins de aplicação em inventários florestais, caracteriza as finitas e as infinitas. Caracteriza os objetivos quando da realização de um levantamento por amostragem. Descreve os parâmetros popula-cionais e os seus estimadores. Mostra a teoria para obtenção de intervalos de confiança e dimensionamento da amostra simples ao acaso. Aborda a amostragem simples ao acaso para propor-ções e porcentagens. Contempla com exemplos todos os temas citados.

55

Amostragem simples ao acaso

Do ponto de vista estatístico, uma população é o conjunto de todos os indivíduos, elementos ou unidades sobre os quais se deseja desenvolver estudos, visando conhecer determinadas características. Quando somente uma parte dos elementos ou unidades é selecionada para o procedimento das análises, tem-se o que se denomina de amostra.

Existem populações finitas e infinitas. Para fins de amostra-gem, determinadas populações finitas podem ser consideradas como infinitas, desde que o tamanho da amostra corresponda a, no máximo, 5 % das unidades da população.

O método da amostra simples ao acaso ou amostra inteira-mente casualizada é o mais tradicional procedimento de amos-tragem.

A amostra simples ao acaso baseia-se num processo estri-tamente aleatório, na qual as unidades amostrais são seleciona-das com igual probabilidade (1/N), em que N é o número total de unidades que compõem o espaço amostral, ou seja, a população amostrada. Na amostra simples ao acaso sem reposição, as unida-des são selecionadas independentemente entre si, e o número de amostras possíveis (nap) de tamanho igual a n é dado pela relação:

)!(!!nNn

N

n

NCnap

��

Não obstante, apenas uma das possíveis combinações é

selecionada para a amostragem, de tal forma que as unidades que comporão a amostra são sorteadas independentemente en-tre si.

Scolforo (1993) cita que, como nem sempre é possível fa-zer uma enumeração completa de todos os indivíduos de uma população florestal, os levantamentos são realizados tendo como base a teoria estatística da amostragem, que é definida

56


como a observação de uma amostra da população para obter estimativas representativas para o todo, sendo constituída de indivíduos que apresentam características comuns que repre-sentem a população a qual pertencem. A amostra é formada por um grupo de unidades amostrais.

No que concerne ao inventário florestal, a amostra simples ao acaso é geralmente conduzida a partir de um sorteio sem reposição, assumindo-se, evidentemente, o pressuposto da per-manência de igual probabilidade para as unidades remanescen-tes em cada sorteio, respaldando-se no fato de que, geralmente, as populações florestais são consideradas estatisticamente infi-nitas, assim como a inclusão de uma unidade amostral mais de uma vez na amostra refletirá uma homogeneização da variância entre as unidades da amostra.

A amostra simples ao acaso, que é um processo congruen-te, ou seja, quando n = N, as estimativas coincidem com os valo-res populacionais, é recomendada para pequenas áreas flores-tais não superiores a 10.000 ha, com características homogêne-as com respeito às variáveis de interesse e com fácil estrutura de acessibilidade.

Quando da realização de um levantamento por amostra-gem, geralmente, têm-se os seguintes objetivos:

a) estimar o valor médio para a variável resposta;b) estimar o valor total para a variável resposta;c) estimar a porcentagem ou a proporção sobre a ocorrên-

cia de um certo atributo;d) estimar a variância da variável resposta;e) obter os intervalos de confiança do valor médio e do va-

lor total para a variável resposta.

57


4.1 VALORES POPULACIONAIS E ESTIMADORES

Para formular os valores populacionais e estimadores, será usada a seguinte notação:

N = número total de unidades em que a população foi divi-dida, função direta do tamanho da unidade de amostra;

n = número de unidades de amostra;yi = valor observado da variável resposta concernente à i-

ésima unidade de amostra.

a) valor médioa1) valor médio populacional

N

yY

N

ii∑

== 1 a2) valor médio estimado

n

yy

n

ii∑

== 1

Este estimador é não tendencioso (“unbiased”), pois, tem-se:

Yn

yEyE

n

ii

==∑

= )()( 1

b) valor total b1) valor total populacional

YNY = b2) valor total estimado

yNY =ˆ

58


c) variânciac1) variância populacional

1

)(

1

)()(

2

1

1

2

1

2

−

−=

−

−=

∑∑∑ =

==

NN

yy

N

YyyV

N

iiN

ii

N

ii

c2) variância estimada

1

)(

1

)()(ˆ

2

1

1

2

1

2

−

−=

−

−=

∑∑∑ =

==

nn

yy

n

yyyV

n

iin

ii

n

ii

d) desvio padrãod1) desvio padrão populacional

)()( yVyS =

d2) desvio padrão estimado

)(ˆ)( yVys = e) variância da médiae1) variância da média populacional

)()(

)(N

nN

n

yVyV

−=

e2) variância da média estimada

)()(ˆ

)(ˆN

nN

n

yVyV

−=

59


O valor NnN )( − é denominado fator de correção para população finita. Quando a população for definida como infinita, ou seja, n < 0,05N, não há necessidade de aplicá-lo.

f) erro padrãof1) erro padrão populacional

)()( yVyS =

f2) erro padrão estimado)(ˆ)( yVys =

g) coeficiente de variação

O coeficiente de variação permite interpretar mais facil-mente a variabilidade das observações, viabilizando uma com-paração relativa entre o desvio padrão e a média.

g1) coeficiente de variação populacional

100)(

% ×=Y

ySCV

g2) coeficiente de variação estimado

100)(

%ˆ ×=y

ysVC

h) intervalo de confiança

A estimação consiste em processar os resultados extraídos por amostragem e fazer inferências sobre a população da qual foi extraída aleatoriamente a amostra. Pode-se fazer a estima-ção de parâmetros de duas formas:

100)(

%ˆ ×=y

ysVC

60


Estimação por ponto: quando a partir da amostra obtém-se um único valor para estimar um determinado parâmetro popula-cional;

Estimação por intervalo: quando a partir da amostra calcu-la-se um intervalo da forma 21 θθθ ≤≤ , admitindo certa proba-bilidade 1 - a (nível de confiança) de que o intervalo contenha o verdadeiro valor do parâmetro populacional θ . Dessa maneira, a será o nível de significância, isto é, o erro que se comete ao afirmar que, por exemplo, 95 % das vezes o intervalo 21 θθθ ≤≤ contém θ será de 5%.

h1) cálculo do intervalo de confiança para a média popula-cional (Y ) se conhecida a variância populacional :)(yV

Seja y uma variável aleatória distribuída normalmente com média Y e variância )(yV , ou seja, y ~ N[Y , )(yV ]. Então, a mé-dia amostral y também terá distribuição normal com média Y e variância V( y ) = V(y)/n, ou seja, y ~ N[Y ,V (y)/n].

Seja a variável padronizada

y

ySYy

z)(

−= .

A variável z é denominada normal reduzida com média

zero e variância igual a 1. A Figura 4.1 mostra a forma gráfica dessa distribuição padrão z e, na Tabela 1 do Anexo, as proba-bilidades.

61


Figura 4.1 - Forma gráfica da distribuição normal reduzida.

Da construção gráfica ilustrativa da distribuição normal, pode-se escrever que:

aaa −=≤≤− 1)(22

ZZZP

aaa −=≤−

≤− 1))(

(22

Z

n

ySYy

ZP

Portanto:

aaa −=+≤≤− 1)/)(/)((22

nySzyYnySzyP

h2) cálculo do intervalo de confiança para média populacio-nal (Y ) se desconhecida a variância populacional V(y).

No caso do desconhecimento da variância populacional, de-ve-se calcular a estimativa do desvio padrão através da amostra.

Seja o gráfico da função densidade da variável “t” de Stu-dent, que é simétrico e tem uma forma parecida com a da dis-tribuição normal (Figura 4.2), entretanto, menos achatada, com média zero e variância igual a )2( −kk , em que k > 2 (graus de liberdade).

62


Figura 4.2 - Forma gráfica da distribuição “t” de Student.

Da construção gráfica ilustrativa da distribuição “t” de Stu-dent, tem-se:

a−=≤≤− aa 122)ttt(P , resultando:

aaa −=+≤≤− 1))()(

(22 n

ystyY

n

ystyP

A estrutura matemática para o cálculo do intervalo de con-

fiança pode ser apresentada de uma forma mais simples:

IC )(ystyIC ×±=

Assim, tem-se: IC

n

ys

N

nNtyIC

)()( ×

−±= , para populações finitas;

IC n

ystyIC

)(±= , para populações infinitas;

IC )(( ystyNIC ×±= , para o valor total.

63


i) dimensionamento da amostra simples ao acaso.

Dados, respectivamente, os estimadores da variância da média e do intervalo de confiança como anteriormente definidos:

)()(ˆ

)(ˆN

nN

n

yVyV

−= e IC )(ystyIC ×±=

Seja E = t yLEE ×= s )(ystE ×= a semiamplitude do intervalo de confian-ça, conhecida no jargão da engenharia florestal brasileira como expectância do erro, valor normalmente fixado de acordo com o grau de precisão desejado. Essa semiamplitude pode ser fixada como um valor percentual da média, ou seja, E = LE yLEE ×= . Neste caso, LE é denominado limite de erro.

A fórmula para conseguir o número de unidades de amos-tra (n), atendendo um limite de erro predefinido, é obtida da se-guinte forma:

)(ystE ×=)(

)(ˆ)(ˆ 222

N

nN

n

yVtyVtE

−==

)1()(ˆ

22

N

n

n

yVtE −=

N

yVt

n

yVtE

)(ˆ)(ˆ222 −=

Resultando para o caso de populações finitas:

N

yVtE

yVtn

)(ˆ)(ˆ

22

2

+=

No caso de populações infinitas, tem-se:

n

yVtE

)(ˆ= , resultando:

64


2

2 )(ˆ

E

yVtn =

Por outro lado, é factível ocorrer que os recursos financeiros disponíveis sejam um fator limitante. Neste caso, Husch, Miller e Beers (1972) recomendam que a intensidade de amostragem seja estabelecida através da seguinte equação linear de custo:

c = c0 + nc1

c = custo total do inventário (medição de campo);c0 = custos fixos (planejamento e trabalhos de escritório);c1 = custo médio por unidade de amostra;n = número de unidades de amostra.

O componente nc1 corresponde ao custo total da coleta de dados de campo.

exercício 4.1

Seja uma área florestal de 3.574 ha, localizada na região de Marajó, onde, a partir de uma amostra simples ao acaso, fo-ram enumeradas 27 unidades. A unidade amostral de 2.500 m2 apresentou uma forma retangular de 10 m de largura e 250 m de comprimento, onde foram mensuradas todas as árvores com DAP 45 cm, enquanto que para as árvores com 15 cm DAP < 45 cm foi estabelecida uma subamostra de 1.000 m2, compreen-dendo 10 m de largura por 100 m de comprimento. A Tabela 4.1 apresenta os resultados dos volumes para as árvores contidas em 15 cm DAP < 45 cm; e a Tabela 4.2, os volumes para as árvores com DAP 45 cm. O cálculo do volume por árvore foi

65


obtido através da equação de volume VSC HDAPVSC25179,00775,0ˆ += ,

desenvolvida por Queiroz (1984), sendo:VSC = volume sem casca por árvore;DAP = diâmetro a altura do peito com casca;H = altura comercial.Efetuar a análise considerando os seguintes casos:1) Análise estatística da variável volume no intervalo 15 cm

DAP < 45 cm.2) Análise estatística da variável volume para DAP 45 cm.

tabela 4.1 - Volume (m3/0,1 ha) para 15 cm DAP < 45 cm.

UA Yi UA Yi UA Yi UA Yi UA Yi

1 6,45 7 9,289 13 6,208 19 11,700 25 9,642

2 17,00 8 9,915 14 14,21 20 10,080 26 7,549

3 4,31 9 10,540 15 6,356 21 8,765 27 2,937

4 7,53 10 6,597 16 9,975 22 5,508

5 7,21 11 7,193 17 9,953 23 4,292

6 4,19 12 13,92 18 9,731 24 7,173

tabela 4.2 - Volume (m3/0,25 ha) para DAP 45 cm.

UA Yi UA Yi UA Yi UA Yi UA Yi

1 12,9914 7 21,9215 13 17,5972 19 14,5159 25 18,3705

2 16,1036 8 17,4466 14 24,0426 20 29,7010 26 25,3622

3 9,6805 9 22,1176 15 16,7197 21 30,4842 27 18,5761

4 20,0752 10 12,8449 16 21,8991 22 14,6925

5 29,6375 11 16,5398 17 10,4113 23 18,9567

6 23,4207 12 17,0837 18 10,0260 24 19,6981

66


1) Análise estatística da variável volume no intervalo 15 cm dAp < 45 cm

a) valor médio estimado

y = 84,41m3/ ha b) valor total estimado

yNY ×=ˆ = 35.740 × 8,4406667 = 301.669,43 m3, para:

N = Área/T.U.A = 3574 ha/0,1 ha = 35.740

T.U.A = Tamanho da Unidade de Amostra

c) variância estimada

d) desvio Padrão estimado

23

21

2

1

2

)1,0/(6883,1026

27

8980,2275079,2201

1

)(

)(ˆ hamn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

�

232 )/(8342,10686883,1010)(ˆ hamyV ��

hamn

y

y

n

i

i

1,0/4407,827

898,227 31��

��

hamhayVys /6930,32/)(ˆ)(3��

67


e) variância da média estimada

f) erro padrão estimado

hamhayVys /29,6/)(ˆ)( 3��

g) coeficiente de variação estimado

%73,38100406667,84

69303,32100

)(%ˆ

��

y

ysVC

h) intervalo de confiança (IC)

Na Tabela 3 do Anexo, tem-se o valor tabelar para a= 0,05 e n - 1 = 26:

0555,21,

2

=−n

ta Limite inferior para o valor médio

)(ysty ×− =84,406667-2,0555x6,289399= 71,48 m3/ ha

Limite superior para o valor médio)(ysty ×+ = 84,406667 + 2,0555 x 6,2893995 = 97,33 m3/ ha

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio real para o volume das árvores com 15 cm DAP < 45 cm encontra-se no intervalo de 71,48 m3/ ha a 97,33 m3/ ha.

Limite inferior para o valor totalárea )([ ysty ×− ]=3574 x 71,478806 =225.465,25 m3

Limite superior para o valor totalárea )]([ ysty �� = 3574×97,334528= 347.873,60 m3

23)/(5565,39)

35740

2735740(

27

8342,1068)(

/)(ˆ)(ˆ ham

N

nN

n

hayVyV �

�

�

�

�

68


Pode-se afirmar, com uma probabilidade de acerto de 95%, que o volume total real para a população florestal de 3.574 ha encontra-se no intervalo de 225.465,25 m3 a 347.873,60 m3.

i) limite de erro

)(ystE ×= = 2,0555 × 6,2893995 = 12,927861 m3/ha

j) dimensionamento da amostra

Considerando que o limite de erro requerido para o inven-tário florestal seja de LE = 0,1 (10 %). O resultado do limite de erro obtido para a variável resposta volume (15 cm DAP 45 cm) foi de 15,32 % para 27 unidades de amostra. Então, deve-se calcular o número de unidades de amostra, visando atender ao limite de erro desejado de LE = 0,1 e, finalmente, calcular o número de unidades faltantes.

n = 64 unidades de amostra

Para:

E = LE yLEE ×= = 0,10 x 84,406667 = 8,4406667 m3/ha

Concluindo que se deve voltar ao campo e medir mais 37 unidades de amostra para atender ao limite de erro fixado em LE = 0,1.

27,63

35740

8342,10680555,24406667,8

8342,10680555,2

)(ˆ

)(ˆ

22

2

22

2

�

��

��

�

�

N

yVtE

yVtn

%32,15100406667,84

927861,12100% ��

y

ELE

69


2) Análise estatística da variável volume para dAp 45 cm


hamn

y

y

n

i

i

25,0/9228,1827

9161,501 31 ��

�� , onde: = 75,69 m3/ha

b) valor total estimado

yNY ×=ˆ = 14296 x 18,922819 = 270.520,61 m3, onde:

N = Área/T.U.A. = 3574 ha/0,25 ha = 14.296


d) desvio padrão estimado



m3/ ha

y

23

21

2

1

2

)25,0/(8930,3226

27

9161,510191,10523

1

)(

)(ˆ hamn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

�

232 )/(2885,52689303,324)(ˆ hamyV ��

)/(94,222885,526/)(ˆ)( 3 hamhayVys ��

23 )/(4553,19)14296

2714296(

27

28847,526)(

/)(ˆ)(ˆ ham

N

nN

n

hayVyV �

�

�

�

�

41.44553,19/)(ˆ)( �� hayVys

70



h) intervalo de confiança (IC) Limite inferior para o valor médio

)(ysty ×− =75,691276-2,0555 x 4,4108221= 66,62 m3/ ha

Limite superior para o valor médio)(ysty ×+ = 75,691276 + 2,0555 x 4,4108221= 84,76 m3/ ha

Há razão para afirmar, com uma probabilidade de acerto de

95%, que o valor médio real da floresta para o volume das árvo-res com DAP 45 cm encontra-se no intervalo de 66,62 m3/ ha a 84,76 m3/ ha.

Limite inferior para o valor total área[ )(ysty ×− ] = 3574 x 66,624831= 238.117,15 m3

Limite superior para o valor totalárea[ )(ysty ×+ ] = 3574 x 84,757721= 302.924,09 m3

Dado 0555,2

1,2

=−n

ta para a = 0,05 e n - 1 = 26.

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional real da floresta para o volume das árvores considerando DAP 45 cm encontra-se no intervalo de 238.117,15 m3 a 302.924,09 m3.

%31,3010069,75

94,22100

)(%ˆ

��

y

ysVC

71


i) limite de erro

=×= )(ystE 2,0555 x 4,4108221 = 9,0664448 m3/ ha

j) dimensionamento da amostra

Supondo-se que o limite de erro requerido para o inventário florestal seja de LE = 0,1 (10 %). O resultado do limite de erro obtido para a variável resposta volume com DAP 45 cm foi de 11,98 % para 27 unidades de amostra. Então, deve-se calcular o número de unidades de amostra, visando atender ao limite de erro desejado de LE = 0,1 e, finalmente, calcular o número de unidades faltantes.

n = 39 unidades de amostra=×= )(ystE 0,1 x 75,691276 = 7,5691276 m3

Conclui-se que se deve voltar ao campo e medir mais 12 unidades de amostra, para totalizar 39 unidades e assim atender ao limite de erro fixado de LE = 0,10, visto que foram medidas apenas 27 unidades.

4.2 AMOSTRAGEM SIMPLES AO ACASO PARA PROPOR-çõES E PORCENTAGENS

Em inventários florestais, frequentemente, deseja-se esti-mar o número total, a proporção ou a porcentagem de unida-

71,38

14296

2885,5260555,25691276,7

2885,5260555,2

)(ˆ

)(ˆ

22

2

22

2

�

��

��

�

�

N

yVtE

yVtn

71,38

14296

2885,5260555,25691276,7

2885,5260555,2

)(ˆ

)(ˆ

22

2

22

2

�

��

��

�

�

N

yVtE

yVtn

72


des da população que apresenta certa característica ou atributo. Alguns resultados como número de árvores mortas, a porcen-tagem de ocorrência de uma determinada espécie, número de árvores que estão produzindo sementes são informações muitas vezes requeridas em alguns inventários.

A classificação do atributo, na maioria dos levantamen-tos, pode ser incluída na ficha de campo sob forma de pergunta construída para ser respondida com um simples “sim” ou “não”.

Seja uma população com N unidades, tal que qualquer uni-dade pertença a uma das duas categorias C1 e C0, sendo que C1 corresponde às unidades que possuem o atributo desejado e C0 define as unidades que não o possuem. Então, pode-se definir:

A = número de unidades da população que pertence à ca-tegoria C1;

a = número de unidades da amostra classificado na cate-goria C1;

N = tamanho da população;n = tamanho da amostra;

NAP /= é a proporção de unidades da categoria C1 na população;

nap /= é a proporção de unidades da categoria C1 na amostra.

Tem-se que p é uma estimativa de P e Np é uma estimativa de A.

Em inventários florestais, a distribuição binomial é a mais usada para obter as estimativas de a e p, pois, frequentemente, as populações são infinitas. Para populações finitas, a distribui-ção binomial constitui uma boa aproximação, embora a distribui-ção correta, neste caso, seja a hipergeométrica.

73


4.2.1 valores populacionais, estimadores e dimensiona-mento da amostra

Para quantificar os resultados, seja a seguinte regra para qualquer unidade iy da amostra ou da população:

1=iy , se iy estiver contido em C1;0=iy , se iy estiver contido em C0;

Para a população de valores iy , resulta que:

∑=

==N

ii AyY

1

Para a amostra de valores iy , tem-se:

∑=

=n

ii ay

1

Dado que yNY =ˆ , então .ˆ Npn

aNY =×=

Np

A estimação de A e P consiste em obter os valores médio e total de uma população, onde todos os iy têm valor 1 ou 0. Então:

PN

A

N

yY

N

ii

===∑

=1

pn

a

n

yy

n

ii

===∑

=1

74


Por conseguinte:

Para: PQ −= 1

Destarte:

11

)()(ˆ 1

2

−=

−

−=∑

=

n

npq

n

yyyV

n

ii

Então:

Por conseguinte:

Para o valor total populacional e seu estimador:

)()()ˆ( 2 pVNNpVYV == V (Np) = N2V(p)

)(ˆ)(ˆ)ˆ(ˆ 2 pVNNpVYV ==

��

��N

i

i NpAy1

2

��

��n

i

i npay1

2

11

)1(

111

)(

)(2

2

1

2

1

2

��

�

��

�

��

�

�

��

�

�

��

N

NPQ

N

PNP

N

NPNP

N

YNy

N

Yy

yV

N

i

i

N

i

i

n

PQ

N

nN

N

NPQ

Nn

nN

n

yV

N

nNpVyV )

1(

1)(

)()()()(

�

�

�

�

�

�

�

��

pqnN

nN

n

npq

Nn

nN

n

yV

N

nNpVyV

)1(

)(

1)(

)(ˆ)()(ˆ)(ˆ

�

�

�

�

�

�

�

��

Np

75


Para obter o intervalo de confiança para P, considera-se que os dados seguem uma distribuição aproximadamente nor-mal, resultando:

, onde Nnf /= e o termo

n2/1 é uma correção de continuidade.

Para o valor total Y , virá:

O dimensionamento da amostra é o mesmo discutido ante-riormente, onde conhecendo: ,t )(ˆ yV e E , têm-se:

1)(ˆ

−=

n

npqyV

E = LE yLEE ×=

pn

a

n

yy

n

ii

===∑

=1 .

Dado que:

)(ystE ×= e n

yV

N

nNpVyV

)()()(ˆ)(ˆ −

== .

Então:

1)(

1

1)()(ˆ)(ˆ

−−

=−

×−

==n

pq

N

nN

n

npq

nN

nNpVyV

Portanto:

]2

1)1/(1[

nnpqftpIC ��

]2

1)1/(1[ˆ

nnpqftNYIC ��

pq

76


exercício 4.2

Seja uma pesquisa sobre a ocorrência de uma determinada doença em um povoamento florestal com 100.000 árvores, onde foi tomada uma amostra simples ao acaso de 800. Verificou-se que 90 plantas da amostra apresentaram os sintomas da doença. Estimar a proporção e o número total de plantas doentes do povoamento.

Dado que:000.100�N ; ;800�n ;90�a . Tem-se:

;008,0000.100

800��f ;1125,0800/90/ �� nap

.8875,01125,011 �� pq

8875,01125,0799000.100

)800000.100(

)1(

)()(ˆ)(ˆ

��

�

�

�

�

�

�� pqnN

nNpVyV

0150001239612,0)1(

)()(ˆ)(ˆ

�

�

�

�� pqnN

nNpVyV

011133786,0)(ˆ)( �� pVps

Têm-se:

)1(11)1(

1)(

22

222

�

�

�

�

�

��

�

�

�

nN

npqt

n

pqt

n

pq

N

nt

n

pq

N

nNtE

N

npqtpqtEn

222)1( ��

N

npqtpqtEnE 2222

��

pqtEN

npqtnE

2222��

N

pqtE

Epqtn

2

2

22

�

�

�

000.100�N ; ;800�n ;90�a . Tem-se:

;008,0000.100

800��f ;1125,0800/90/ �� nap

.8875,01125,011 �� pq

8875,01125,0799000.100

)800000.100(

)1(

)()(ˆ)(ˆ

��

�

�

�

�

�

�� pqnN

nNpVyV

0150001239612,0)1(

)()(ˆ)(ˆ

�

�

�

�� pqnN

nNpVyV

011133786,0)(ˆ)( �� pVps

77


Resultando o seguinte intervalo de confiança para P usan-do t = 2,0 ( 05,0=a 0,05):

Conclui-se que, com 95% de probabilidade de acerto, a proporção de plantas doentes situa-se no intervalo de 0,0889 a 0,1354.

Dado que yNY =ˆ ou

Então, o intervalo de confiança para o total, será:

Conclui-se que, com 95% de probabilidade de acerto, o número esperado de plantas doentes situa-se no intervalo de 8.890 a 13.540, que corresponde a um limite de erro de 19,79%.

]2

1)1/(1[

nnpqftpIC ��

]8002

1799/8875,01125,0008,010,2[1125,0

��IC

022892752,01125,0]8002

101117859,09960,00,2[1125,0 ��

��IC

1354,00896,0 �� P

.250.111125,0000.100ˆ�� Np

n

aNY

78


Supondo que o limite de erro requerido para o levanta-mento seja de LE = 0,1 (10 %). O resultado do limite de erro obtido para a variável resposta (ocorrência da doença) foi de 19,79 para 800 unidades de amostra. Então, deve-se calcular o número de unidades de amostra, visando atender ao limite de erro desejado de LE = 0,10 e, finalmente, calcular o número de unidades faltantes.

Dado:

pn

a

n

yy

n

ii

===∑

=1

09996871,0799

8875,01125,0800

1)(ˆ =

××=

−=

n

npqyV

Então:

Conclui-se que é necessário retornar ao campo e medir mais 2.260 plantas, para totalizar 3.060 unidades e assim aten-der ao limite de erro fixado de LE = 0,10, visto que foram medi-das apenas 800 unidades.

060.3

000.100

8875,01125,02)1125,010,0(

)1125,010,0(8875,01125,022

2

22

22

22

�

��

��

��

�

��

N

pqtE

Epqtn

cApítulo 5

AmostrAgem estrAtIFIcAdA

Define a amostragem estratificada e apresenta recomen-dações de quando aplicá-la em inventário florestal. Descreve os critérios para se proceder à estratificação. Descreve os pa-râmetros populacionais e os seus estimadores. Mostra a teoria para obtenção de intervalos de confiança e dimensionamento da amostra, assim como compara a precisão desta em relação à amostra simples ao acaso. Descreve um estudo de caso para inventário florestal de áreas extensas apresentando subpopula-ções com diferentes intensidades de amostragem, o que poderá ocorrer no Inventário Florestal Nacional (IFN) do Brasil quando da realização do levantamento na Amazônia. Mostra exemplos sobre todos os temas citados.

81

Amostragem estratificada

A amostragem estratificada consiste em dividir uma po-pulação de tamanho N em L subpopulações constituídas de

LNNN ,,, 21 L unidades, tal que não haja superposição e, juntas, totalizem a população de tamanho N, ou seja:

∑=

=L

hhNN

1

, tal que .,,1 Lh L=

As subpopulações, denominadas estratos, devem ter os valores Nh conhecidos, pois dentro de cada estrato, separada-mente, seleciona-se uma amostra de tamanho nh. A grandeza amostral para a população será igual a .21 Lnnnn +++= L

Em inventários florestais, a amostragem estratificada é re-comendável para o estudo de populações florestais que apre-sentem heterogeneidade entre as subpopulações com referên-cia à variável de interesse. Nesse caso, a estratificação pode propiciar um aumento no grau de precisão do inventário, pois, torna possível subdividir uma população heterogênea em estra-tos que, individualmente, sejam homogêneos, resultando ganho em eficiência e diminuição dos custos.

A determinação dos estratos é feita em função das carac-terísticas peculiares da população florestal, onde, em muitos ca-sos, os estratos já estão fisicamente definidos, como no caso de povoamentos florestais plantados com talhões de diferentes idades. Por outro lado, existem casos em que a delimitação dos estratos (tipos florestais) só é possível através de levantamentos aerofotogramétricos. O processo para obter os estratos denomi-na-se estratificação e a amostra é dita estratificada.

Denomina-se amostra acidental estratificada quando são selecionadas amostras inteiramente ao acaso nos estratos.

De acordo com Cochran (1965), há diversos critérios para se proceder à estratificação. Os principais são os seguintes:

82


a) a estratificação ideal é aquela realizada segundo a magni-tude do valor da variável de interesse, obtendo-se ganho de preci-são quando houver variação sensível entre os estratos definidos;

b) a estratificação de conformidade com a variação da ve-getação pode ser de interesse para o inventário florestal; entre-tanto, não é assegurado, com relação às variáveis respostas, existir variabilidade entre os estratos. Por outro lado, se houver correlação entre o tipo de vegetação e os valores das variáveis respostas, então a estratificação com base na florística resultará na estratificação das variáveis respostas; nesse caso, há ganho de precisão;

c) razões administrativas podem direcionar para a utiliza-ção da estratificação, visando principalmente caracterizar pecu-liaridades locais ou regionais.

Existem casos em que, por falta de informações prelimina-res ou mesmo ausência de instrumentos que possam viabilizar a estratificação da floresta, pode-se, depois de tomada a amostra, proceder a uma pós-estratificação com respeito às variáveis res-postas mensuradas.

Inventários florestais delineados a atender a planificação de técnicas de manejo de florestas naturais, obrigatoriamente, devem abranger e explicar as principais variáveis que compõem a estrutura do povoamento. Nesse caso, verifica-se que são re-queridas diversas variáveis, as quais estão inter-relacionadas, e, para tornar possível caracterizar a estrutura desses tipos flores-tais, é necessário analisá-las estatisticamente através de técni-cas de análise multivariada. Para proceder à análise estatística dessas informações multidimensionais, Queiroz (1984) apresen-ta uma metodologia de pós-estratificação multidimensional fun-damentada na análise de fatores, através do método da máxima verossimilhança, para um conjunto de variáveis respostas, vi-

83


sando obter mapas tipológicos para um povoamento florestal lo-calizado na região do planalto da Floresta Nacional do Tapajós.

5.1 VALORES POPULACIONAIS E ESTIMADORES POR ES-TRATO

Para formular os valores populacionais e estimadores, será usada a seguinte notação:

N = número total de unidades em que a população foi di-vidida;

hN = número de unidades em que o h-ésimo estrato foi dividido;

n = número de unidades de amostra a serem medidas considerando todos os estratos;

hn = número de unidades de amostra a serem medidas no h-ésimo estrato;

yhi = valor observado da variável resposta referente à i-ésima unidade de amostra no h-ésimo estrato;

N

NW h

h = = peso do h-ésimo estrato;

h

h

N

n = fator de amostragem no h-ésimo estrato;

h

h

n

N = fator de expansão no h-ésimo estrato;

L= número de estratos.A formulação da análise estatística a ser apresentada refe-

re-se à aplicação em cada estrato da amostra simples ao acaso.

a) valor médio por estrato

84


a1) valor médio populacional por estrato

h

N

i

hi

hN

y

Y

h

�� 1

a2) estimador do valor médio por estrato

h

n

i

hi

hn

y

y

h

�� 1

b) valor total por estratob1) valor total populacional por estrato

hhh YNY =

b2) estimador do valor total por estrato

hhh yNY =ˆ

c) variância por estratoc1) variância populacional por estrato

1

)(

1

)(

)(

1

2

1

22

1

�

�

��

�

�

��

�

��

h

h

N

i

hiN

i

hi

h

N

i

hhi

hN

N

y

y

N

Yy

yV

h

hh

c2) estimador da variância por estrato

1

)(

1

)(

)(ˆ

1

2

1

22

1

�

�

��

�

�

��

�

��

h

h

n

i

hin

i

hi

h

n

i

hhi

n

n

y

y

n

yy

yV

h

hh

85


d) desvio padrão por estratod1) desvio padrão populacional por estrato

)()( yVyS hh =

d2) estimador do desvio padrão por estrato

)(ˆ)( yVys hh =

e) variância da média por estratoe1) variância da média populacional por estrato

)()(

)(h

hh

h

hh N

nN

n

yVyV

−=

e2) estimador da variância da média por estrato

)()(ˆ

)(ˆh

hh

h N

nN

n

yVyV

−=

Em relação à aplicação da amostragem, uma população pode ser classificada como finita ou infinita. Determinadas po-pulações finitas podem ser consideradas infinitas desde que o tamanho da amostra seja no máximo 5% da área, ou seja:

1) Se ,95,0)( ≥−hNhh nN ,95,0)( ≥−

hNhh nN ,95,0)( ≥−hNhh nN 0,95, a população é denominada in-

finita;2) Para ,95,0)( <−

hNhh nN ,95,0)( ≥−hNhh nN <0,95, a população é definida como

finita. O termo

hNhh nN )( − ,95,0)( ≥−hNhh nN é denominado correção para popu-

lação finita.

86


f) erro padrão por estratof1) erro padrão populacional por estrato

)()( hh yVyS =

f2) estimador do erro padrão por estrato

)(ˆ)( hh yVys =

g) coeficiente de variação por estratog1) coeficiente de variação populacional por estrato

100)(

% ��

h

h

hY

ySCV

g2) estimador do coeficiente de variação por estrato

100)(

%ˆ ×=h

hh y

ysVC

h) intervalo de confiança por estratoh1) intervalo de confiança para a média populacional por es-

trato ( hY ), se conhecida a variância populacional por estrato Vh(y).

aaa −=+≤≤− 1))()(

( 2/2/

h

hhh

h

hh

n

ySZyY

n

ySZyP

h2) intervalo de confiança para a média populacional por estrato (

hY ), se desconhecida a variância populacional por es-trato Vh(y).

aaa −=+≤≤− 1))()(

( 2/2/

h

hhh

h

hh

n

ystyY

n

ystyP

Ou, simplesmente,

IC )( hh ystyIC ×±=

87


IC

h

h

h

hhh

n

ys

N

nNtyIC

)(×

−±= (populações finitas)

IC h

hh

n

ystyIC

)(±= (populações infinitas)

5.2 VALORES POPULACIONAIS E ESTIMADORES CONSIDE-RANDO TODOS OS ESTRATOS

a) valor médio global (média estratificada)a1) média estratificada populacional

∑∑==

==L

hhh

L

hh

hest YWY

N

NY

11

a2) estimador da média estratificada

h

L

hhh

L

h

hest yWy

N

Ny ∑∑

==

==11

A estimativa da média estratificada ( esty ), geralmente, não apresenta o mesmo valor da média amostral ( y ).

n

yny

hn

hhh∑

== 1

A média estratificada ( esty ) e a média amostral ( y ) somen-te são coincidentes quando a fração amostral é a mesma para todos os estratos. Neste caso, a estratificação é definida com alocação ou partilha proporcional, fornecendo uma amostra au-toponderada, tendo-se:

88


N

n

N

n

h

h =

b) valor total globalb1) valor total global populacional

estYNY = b2) estimador do valor total global

estyNY =ˆ

c) variância da média estratificadac1) variância da média estratificada populacional

)()(1

h

L

h

hest y

N

NVyV ∑

=

= . Então:

∑ ∑= =

−==

L

h

L

h h

hh

h

hhhhest N

nN

n

yVWyVWyV

1 1

22 )()(

)()(

c2) estimador da variância da média estratificada

∑=

−=

L

h h

hh

hhest N

nN

n

yVWyV

1

2 )()(ˆ

)(ˆ

Desenvolvendo, tem-se:

∑∑==

−=L

h

hhL

h h

hest N

yVW

n

yVWyV

11

2 )(ˆ)(ˆ)(ˆ

d) erro padrão da média estratificadad1) erro padrão da média estratificada populacional

∑ ∑= =

−=L

h

L

h

h

h

hhest N

yVW

n

yVWyS

1 1

2 )()()(

89


d2) estimador do erro padrão da média estratificada

∑∑

=

=−=L

h

L

hhh

h

hest N

yVW

n

yVWys

1

12 )(ˆ

)(ˆ)(

e) intervalo de confiança para o valor médio global IC )( estest ystyIC ×±=

Para a obtenção do valor “t” tabelar, recomenda-se proce-der da seguinte forma:

e1) tomar t = 2 se a amostra é grande;

e2) se a amostra é pequena e se os estratos possuem ba-sicamente a mesma variância, toma-se como número final de graus de liberdade a soma dos graus de todos os estratos:

;)1(1

��

��L

h

hGLnn

e3) se a amostra é pequena e as variâncias dos estratos são diferentes (heterogêneas), calcula-se o número de graus de liberdade pelo método de Satterthwaite (1946), ou seja:

�

�

�

�

�

�L

h h

hh

L

h

hh

Gl

n

yVg

yVg

n

1

22

2

1

1

)(

])([

, onde .)(

h

hhhh n

nNNg

−=

90


f) intervalo de confiança para o valor total global

)]([)ˆ(ˆestest ystyNYstYIC ��

g) dimensionamento da amostra acidental estratificada

Na amostragem estratificada, a definição do tamanho da amostra se faz, fundamentalmente, através de duas formas de alocação ou partilha nos estratos.

1) Alocação ou partilha proporcional.

2) Alocação ou partilha ótima.

1) Alocação ou partilha proporcional

Na alocação proporcional, a definição do número de uni-dades n da amostra é obtida atendendo-se à proporcionalidade dos estratos:

N

N

n

n hh = , para nh = nWh

Dada a fórmula da variância da média estratificada estima-da:

∑∑==

−=L

h

hL

h h

hhest N

yVW

n

yVWyV

11

2 )(ˆ)(ˆ)(ˆ

Substituindo hn por nh = nWh , tem-se:

� ��

��L

h

L

h

hh

h

hh

estN

yVW

nW

yVWyV

1 1

2)(ˆ)(ˆ

)(ˆ

Seja E = )( estyst × a semiamplitude do intervalo de confian-

ça ou expectância do erro. Então:

91


)(ˆ)]([ 2222

estest yVtystE ��

])(ˆ1)(ˆ[

11

2

22

��

��L

h

h

L

h h

h yVWNnW

yVWtE

��

��L

h

hh

L

h

hh yVWN

tyVW

n

tE

1

2

1

22

)(ˆ)(ˆ

��

��L

h

h

L

h

h yVWN

tEyVW

n

t

1

2

1

22

)(ˆ)(ˆ

��

��

L

h

h

L

h

h yVWN

tEnyVWt

1

2

1

22)](ˆ[)(ˆ

�

�

�

�

�

�L

h

h

L

h

hh

yVWN

tE

yVWt

n

1

22

1

2

)(ˆ

)(ˆ

A partilha dentro dos estratos é feita de tal forma que nh = nWh.

2) Alocação ou partilha ótima

Na alocação ótima, a definição da intensidade de amostra-gem n e as grandezas amostrais nos estratos nh são definidas tendo em vista tornar mínimo o valor da variância da média es-tratificada )( estyV dentro de determinado limite de custo ou tor-nar mínimo o custo para um valor fixado de V( esty ).

Seja a função custo linear mais simples a ser utilizada na dedução:

∑=

+=++++=L

hhhLL nCCnCnCnCCC

1022110 ...

92


Sendo:

C = custo total do inventário florestal;C0 = despesas gerais (fixas);Ch = custo médio de medição por unidade medida no h-

ésimo estrato.

Para atender a condição de tornar mínimo o custo para um valor especificado da variância da média estratificada, ou torná-la mínima para um determinado limite de custo, resulta em um problema de estudo de mínimo condicionado. Neste caso, usar o processo de cálculo dos coeficientes de Lagrange, para tornar mínimo o valor de )( estyV , respeitando a seguinte restrição:

02211 CCnC...nCnC LL −=+++.

Dado que:

∑∑==

−=L

hhh

L

h h

hhest yVW

Nn

yVWyV

11

2

)(1)(

)(

E a função de Lagrange Z:

∑=

+−+=L

hhhest CCnCyVZ

10 )()( l

Então, calcula-se hn e o coeficiente l tal que o valor de Z seja mínimo.

∑ ∑

= =

+−++++−=L

hLL

L

hhh

h

hh CCnCnCnCyVWNn

yVWZ

102211

1

2

)...()(1)(

l

Diferenciando em relação a hn (h = 1,...,L), tem-se:

93


112

1

1

2

1)

)(( dnC

n

yVWdZ ��

222

2

2

2

2 ))(

( dnCn

yVWdZ ��

...

hh

h

hh dnCn

yVWdZ )

)((

2

2

��

...

LL

L

LL dnCn

yVWdZ )

)((

2

2

��

Igualando as derivadas parciais a zero, têm-se:

1

111

)(

C

ySWn =l

...

h

hhh

C

ySWn

)(=l (5.1)

...

L

LLL

C

ySWn

)(=l

Efetuando-se o somatório para todos os estratos, tem-se:

∑=

=L

h h

hh

C

ySWn

1

)(l (5.2)

Finalmente, dividindo membro a membro as expressões 5.1 e 5.2, obtém-se:

94


∑=

=L

hhhh

hhhh

CySW

CySW

n

n

1

)/)((

/)(

∑=

=L

hhhh

hhhh

CySW

CySWnn

1

)/)((

/)( (5.3)

A Expressão 5.3 recomenda dimensionar uma amostra maior no estrato, se:

a) o estrato é maior;b) o estrato possui maior variância; c) a medição de campo é mais barata no estrato.Para obter a fórmula para o número definitivo de unidades

de amostra (n) através das estimativas de )(yVh , deve-se fixar a semiamplitude do intervalo de confiança ou expectância do erro

).( estystE ×= ). Logo:

)(ˆ)( 2222estest yVtystE ==

Por conseguinte:

∑ ∑= =

−=L

h

L

hh

h

h yVWNn

yVWtE

1 1

222 ])(ˆ1)(ˆ[

Substituindo hn dado pela Expressão 5.3, tem-se:

��

�

��

�

��L

h

h

L

h

L

h

hhh

hhh

hh yVWN

CysW

CysWn

yVWtE

11

1

2

22 )](ˆ1

/)(

/)(

)(ˆ[

95


])(

()/)([)(ˆ11

2

1

22 ∑∑∑

===

=+L

h

hhhL

hhhh

L

hh n

CysWCysWtyVW

N

tE

])(()/)([])(ˆ[11

2

1

22

hh

L

hh

L

hhhh

L

hhh CysWCysWtyVW

N

tEn ∑∑∑

===

=+

Resultando:

�

� �

�

� �

�

�L

h

hh

L

h

L

h

hhhhhh

yVWN

tE

CysWCysWt

n

1

2

2

1 1

2

)(ˆ

])()(/)([

(5.4)

Se forem admitidos custos iguais para medição das unida-des de amostra nos estratos, tem-se a denominada Partilha de Neyman e as Equações 5.4 e 5.3 passam a ser escritas respec-tivamente por:

,

)(ˆ

])([

122

2

1

2

N

yVWtE

ysWtn

L

hh

L

hhh

∑

∑

=

=

+

= sendo ∑

=

=L

hhh

hhh

ysW

ysWnn

1

)(

)( .

5.3 PRECISãO DA AMOSTRA ESTRATIFICADA EM RELAçãO À AMOSTRA SIMPLES AO ACASO

Quando a estratificação é empregada de forma eficien-te, resulta para os valores da média e do total estimados uma menor variância que a amostra simples ao acaso de grandeza

��

��L

h

hh

L

h hhh

hhL

h

hhh yVWN

t

CysnW

yVWCysWtE

1

2

1

2

1

22 )(ˆ]/)(

)(ˆ()/)([

96


similar. Por outro lado, não é verdadeiro afirmar que qualquer amostra estratificada seja mais precisa que uma amostra sim-ples ao acaso, considerando-se uma mesma fração amostral. Por exemplo, se em uma amostra estratificada os valores de nh estiverem muito diferentes do ótimo, obviamente a amostragem estratificada poderá ser menos precisa.

Do exposto, pode-se dizer que a finalidade principal da es-tratificação é diminuir a variância da média e a variância do total, quando comparadas com suas similares da amostra simples ao acaso.

Considerando as populações infinitas e para uma mesma grandeza amostral n, sejam as variâncias das médias nos se-guintes casos:

a) variância da média da amostra simples ao acaso

n

yVyVAsa

)()( =

b) variância da média (alocação proporcional)

VProp � ��

��L

h

L

h

hhhhL

h

L

h h

hh

h

hh

opnN

yVN

n

yVW

nW

yVW

n

yVWyV

1 11 1

22

Pr

)()()()()(

c) variância da média (alocação ótima)

2

1

2

1

1

2

1

2 )]([

)(

)(

)()()(

nN

ySN

ySW

ySWn

yVW

n

yVWyV

L

h

hhL

h

L

h

hh

hh

hhL

h h

hh

Oti

��

�

��

�

�

�

��

Dado que .1

)(

)( 1 1

2

�

�

�

��

N

Yy

yV

L

h

N

i

hi

h

97


Então, .)()()1(1 1

2∑∑= =

−=−L

h

N

ihi

h

YyyVN

Efetuando-se a partição da variação total nos componen-tes de variância entre e dentro dos estratos:

∑ ∑= =

−+−=−L

h

L

hhhhh YYNyVNyVN

1 1

2)()()1()()1(

Então:

∑ ∑= =

−+−=−L

h

L

hhhh

hhh YYNyV

NNyV

NN

1 1

2)()()1

1()()1

1(

Desprezando-se as frações 1/N e 1/Nh: NVh (y) ∑ ∑

= =

−+=L

h

L

hhhhhh YYNyVNyNV

1 1

2)()()( Dividindo-se por nN, tem-se:

Pelas definições de )(yVAsa e VProp )(Pr yV op :

)()( Pr yVyV opAsa = VProp )(Pr yV op +

n

YYWL

hhh∑

=

−1

2)(

Pelo exposto, conclui-se que a variância da média da

amostra simples ao acaso será maior que a variância da média da amostra estratificada com alocação proporcional, quando as médias entre os estratos forem diferentes entre si, ou seja, a estratificação somente será eficiente se existirem diferenças sig-nificativas entre as médias dos estratos.

nN

YYN

nN

yVN

n

yV

L

h

hh

L

h

hh ��

�

�� 1

2

1

)()()(

98


Deduz-se, facilmente, que a amostra simples ao acaso terá a mesma precisão da amostra estratificada se houver uma igual-dade completa entre as médias dos estratos. Considerando ser uma afirmação verdadeira que a alocação ótima adiciona preci-são na amostragem estratificada, então:

Denominando-se ∑

∑=

= ==L

hhh

L

hhh

ySWN

ySNyS

1

1 )()(

)( :

Finalmente:

2

1

2

1Pr

)]([)(

)()(nN

ySN

nN

yVN

yVyV

L

h

hh

L

h

hh

Otiop

��

}

)]([

)({1

)()( 1

2

1

PrN

ySN

yVNnN

yVyV

L

h

hhL

h

hhOtiop

��

�

�

��

��

�

�� L

h

L

h

hh

L

h

hh

hhOtiopN

ySN

N

ySN

yVNnN

yVyV1

1

2

1

2

Pr}

)]([)]([2

)({1

)()(

��

�

��

L

h

L

h

hh

L

h

L

h

hhhh

hhOtiopN

ySNN

N

ySNySN

yVNnN

yVyV1

2

1

2

1 1

Pr }

)]([])()][([2

)({1

)()(

]}

)]([)]()[(2

)([{1

)()(2

1

2

1

1

PrN

ySN

N

ySNyS

yVNnN

yVyV

L

h

hh

L

h

hhhL

h

hhOtiop

��

��

�

��

}]

)(

)([{1

)()( 21

1

PrN

ySN

ySNnN

yVyV

L

h

hh

h

L

h

hOtiop

��

�

�

��

��

�

�

�

��L

h

l

h

hh

hhotiopn

ySySW

ySySNnN

yVyV1

1

2

2

Pr

)]()([

)]()([1

)()(

n

ySySW

yVyV

l

h

hh

otiop

��

�

�� 1

2

Pr

)]()([

)()(

99


O resultado acima revela que, quando existir heterogenei-dade de variâncias entre os estratos, a alocação ótima é mais precisa que a alocação proporcional.

exercício 5.1

Seja uma área florestal de 10.000 ha, onde, através de téc-nicas de interpretação de imagens fotográficas, foram detecta-dos três estratos:

Estrato I (floresta alta sem babaçu) = 2.000 ha.Estrato II (floresta alta com babaçu) = 5.000 ha.Estrato III (floresta baixa cipoálica) = 3.000 ha.

Foram selecionadas nos estratos, através da amostra sim-ples ao acaso, as seguintes quantidades de unidades de amos-tra: n1 = 13; n2 = 15 e n3 = 12.

A estrutura da unidade amostral apresentou uma forma retangular de 10 m de largura e 250 m de comprimento, onde foram mensuradas todas as árvores com DAP 45 cm. Na Ta-bela 5.1, encontram-se os dados (simulados) por estrato para os volumes por parcela de 0,25 ha.

tabela 5.1 - Volumes em m3 por parcela de 0,25 ha.

ESTRATO I ESTRATO II ESTRATO III

21,1034,0018,0020,0055,0023,4240,5017,44

22,1225,0031,2017,0524,10

12,9017,009,50

20,0030,1023,4221,1017,44

22,1212,0016,5017,0524,1016,7121,80

8,1012,009,50

14,5018,1721,1010,807,50

6,5012,505,205,10

100


Análise estatística relativa ao estrato I



3111 15,726.214840769,26000.8ˆ myNY =×== 8.000 x 26,840769 = 214.726,15 m3

Sendo: N1 = Área/T.U.A = 2.000 ha/0,25 ha = 8.000

T.U.A = Tamanho da Unidade de Amostra




hamn

y

y

n

i

i

25,0/840769,2613

93,348 3

1

1

1

1

1

��

��

hamy /36,1073

1�

23

2

1

1

1

2

1

1

2

1

1 )25,0/(73394,11912

13/93,3483569,10802

1

)(

)(ˆ

1

1

hamn

n

y

y

yV

n

i

in

i

i

��

��

�

�

��

�

�

23

1 )/(7431,1915)(ˆ hamyV �

hamyVys /77,43)(ˆ)(3

11 ��

23

1

11

1

1

1)/(12539,147)

000.8

13000.8(

13

7431,1915)(

/)(ˆ)(ˆ ham

N

nN

n

hayVyV �

�

�

�

�

101




h) intervalo de confiança

Limite inferior para o valor médio )( 111 ysty ×− =107,36308-2,1788 x 12,129525 = 80,94 m3/ ha

Na Tabela 3 do Anexo, tem-se o valor tabelar, ta/2, n1–1 = 2,1788, para a = 0,05 e n1 -1=12.

Limite superior para o valor médio)( 111 ysty ×+ = 107,36308+2,1788x12,129525=133,79 m3/ ha

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato I encontra-se no inter-valo de 80,94 m3/ ha a 133,79 m3/ ha.

Limite inferior para o valor total área[ )( 111 ysty ×− ]= 2.000 x 80,935271= 161.870,54 m3

Limite superior para o valor totalárea )]([ 111 ysty ×+ )] = 2.000 x 133,79089 = 267.581,78 m3

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato I encontra-se no interva-lo de 161.870,54 m3 a 267.581,78 m3.

hamhayVys /13,1212539,147/)(ˆ)(3

11 ��

%77,4010036308,107

769203,43100

)(%ˆ

1

1

1 ��

y

ysVC

102


Análise estatística relativa ao estrato II


2y = 75,13 m3/ ha


222 yNY = = 20.000 x 18,782667 = 375.653,33 m3

Onde N2 = Área/T.U.A = 5.000 ha/0,25 ha = 20.000




hamn

y

y

n

i

i

25,0/782667,1815

74,281 3

2

1

2

2

2

��

��

23

2

2

2

2

1

2

1

2

2

2)25,0/(801607,27

14

15

74,281051,681.5

1

)(

)(ˆ

2

2

hamn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

�

�)(ˆ2 yV 444,8257 23 )/( ham

hamhayVys /09,21/)(ˆ)(3

22 ��

23

2

22

2

2

2 )/(632805,29)000.20

15000.20(

15

8257,444)(

/)(ˆ)(ˆ ham

N

nN

n

hayVyV �

�

�

�

�

103




h) intervalo de confiança Limite inferior para o valor médio

)( 222 ysty ×− = 75,130667 - 2,1448 x 5,4436022 = 63,46 m3/ ha

Na Tabela 3 do Anexo, tem-se o valor tabelar ta/2, n2–1 = 2,1448 para a = 0,05 e n2 - 1 = 14.

Limite superior para o valor médio)( 2222 ysty ×+ =75,130667+2,1448 x 5,4436022=86,81 m3/ ha

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato II encontra-se no in-tervalo de 63,46 m3/ ha a 86,81 m3/ ha.

Limite inferior para o valor total área [ )( 222 ysty ×− ]= 5.000 x 63,45523= 317.276,150 m3

Limite superior para o valor totalárea )([ 222 ysty ×+ ] = 5.000 x 86,806105= 434.030,53 m3

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato II encontra-se no inter-valo de 317.276,150 m3 a 434.030,53 m3.

hamhayVys /44,5/)(ˆ)(3

22 ��

%07,2810013,75

09,21100

)(%ˆ

2

2

2��

y

ysVC

104


Análise estatística relativa ao estrato III


hamn

y

y

n

i

i

25,0/914267,1012

97,130 3

3

1

3

3

3

��

��

3y = 43,66 m3/ ha


== 333 yNY 12.000 x 10,914267 = 130.971,204 m3 Para N3 = Área/T.U.A = 3.000 ha/0,25 ha = 12.000 c) variância estimada

23

2

3

3

2

1

3

1

2

3

3)25,0/(498227,25

11

12

97,1399089,1709

1

)(

)(ˆ

3

3

hamn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

�

�)(ˆ3 yV 407,9716

23)/( ham


hamhayVys /20,209716,407/)(ˆ)( 3

33��

e) variância da média estimada23

3

33

3

3

3 )/(963637,33)000.12

12000.12(

12

97162,407)(

/)(ˆ)(ˆ ham

N

nN

n

hayVyV �

�

�

�

�


hamhayVys /83,5963637,33/)(ˆ)(3

33��

105



%27,46100656667,43

198307,20100

)(%ˆ

3

3

3 ��

y

ysVC

h) intervalo de confiança Limite inferior para o valor médio

)( 333 ysty ×− = 43,656667 - 2,2010 x 5,827833=30,83 m3/ ha

Na Tabela 3 do Anexo, tem-se o valor tabelar,ta/2, n3–1 = 2,2010, para a = 0,05 e n3-1 = 11.

Limite superior para o valor médio )( 333 ysty ×+ = 43,656667 + 2,2010 x 5,827833=56,48 m3/ ha

Há razão para afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato III encontra-se no intervalo de 30,83 m3/ ha a 56,48 m3/ ha.

Limite inferior para o valor totalárea [ )( 333 ysty ×− ]= 3.000 x 30,829607= 92.488,82 m3

Limite superior para o valor total área [ )( 333 ysty ×+ ]= 3.000 x 56,483727= 169.451,18 m3

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato III encontra-se no inter-valo de 92.488,82 m3 a 169.451,18 m3.

106


Análise estatística global

a) média estratificada estimada

91,10000.40

000.127827,18

000.40

000.208408,26

000.40

000.8

1

��

L

h

hhestyWy

hamyest 25,0/0338,183

� , onde:

hamyest

/14,723

�

b) variância da média estratificada

Sejam os seguintes cálculos auxiliares:

0230089,1)(ˆ

)()(ˆ

)()(ˆ

)()(ˆ

3

323

1 2

222

1

1212

=++=∑= n

yV

N

N

n

yV

N

N

n

yV

N

N

n

yVWL

h h

hh

49706,45)(ˆ)(ˆ)(ˆ)(ˆ3

3

2

2

1

1

1

��

yVN

NyV

N

NyV

N

NyVW

L

h

hh

Então:

49706,45000.40

102300,1

)(ˆ)(ˆ)(ˆ

11

2

��

L

h

hhL

h h

hh

estN

yVW

n

yVWyV

23 )25,0/(021872,1)(ˆ hamyV est �

23)/(3499,16)(ˆ hamyV est �

c) erro padrão da média estratificada

hamhayVys estest /04,4/)(ˆ)(3��

107


d) intervalo de confiança para a média estratificada

Considerando que a amostra é pequena e que há heteroge-neidade entre as variâncias, deve-se proceder ao cálculo do número de graus de liberdade (ngl) pelo método de Satterthwaite (1946). A Tabela 5.2 apresenta os cálculos a serem utilizados neste método.

h

hhh

hn

)nN(Ng

��

�

�

�

�

�

�L

h h

hh

L

h

hh

gl

n

yVg

yVg

n

1

22

1

2

1

)(ˆ

)](ˆ[

tabela 5.2 - Número de graus de liberdade – Método de Satterthwaite (1946).

EST hN hn )(h

hhhh n

nNNg

−= )(ˆ yVh )(ˆ yVg hh )1/()(ˆ 22 −hhh nyVg /(nh – 1)

I 8.000 13 4.915.076,92 119,7339 588.501.328,40 288,6115016x1014

II 20.000 15 26.646.666,67 27,8016 740.819.968,10 392,0101498x1014

III 12.000 12 11.988.000,00 25,4982 305.672.421,0 84,94148005x1014

Total 40.000 40 1.634.993.718,0 765,5631319x1014

92,34105631319,765

163499371814

2

�

�

�gl

n

ngl = 35 graus de liberdade

Na Tabela 3 do Anexo, tem-se o valor tabelar ta/2, ngl = 2,0317

para a = 0,05 e ngl = 35.

Limite inferior para o valor médio)( estest ysty ×− = 72,13507 - 2,0317 x 4,0435063=63,92 m3/ ha

Limite superior para o valor médio)( estest ysty ×+ = 72,13507 + 2,0317 x 4,0435063=80,35 m3/ ha

108


Há razão para afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 63,92 m3/ ha a 80,35 m3/ ha.

Limite inferior para o valor total área [ )]([ estest ysty ×− – t x s ( )]([ estest ysty ×−)] = 10.000 x 63,919878 = 639.198,78 m3

Limite superior para o valor total área [ )]([ estest ysty ×− – t x s ( )]([ estest ysty ×−)] = 10.000 x 80,350262 = 803.502,62 m3

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 639.198,78 m3 a 803.502,62 m3.

e) limite de erro para o inventário florestalE = )( estyst× = 2,0317× 4,0435063 = 8,2151917 m3/ ha

%39,1110013507.72

211917,8100% ��

es ty

ELE

f) dimensionamento da amostra estratificada

Considerar o limite de erro para o inventário florestal de 10%. Na análise, o resultado obtido para a variável resposta vo-lume para as árvores com DAP 45 cm foi de 11,39 %, para as 40 unidades de amostra. Então, deve-se calcular o número de unidades de amostra, visando atender ao limite de erro estipula-do de LE = 0,10 e alocar as unidades por estrato, e, finalmente, calcular o número de unidades faltantes por estrato, o que será feito a seguir, utilizando-se os métodos de alocação proporcional e alocação ótima.

109


f1) alocação proporcional

E = LE esty× = 0,10×18,033767 = 1,8033767 m3

49706,45)(ˆ)(ˆ)(ˆ)(ˆ3

32

21

1

1

��

yVN

NyV

N

NyV

N

NyVW

L

h

hh

66,57

000.40

49706,450317,28033767,1

49706,450317,2

)(ˆ

)(ˆ

22

2

1

2

2

1

2

��

�

��

�

�

�

�

�

�

N

yVWt

E

yVWt

nL

h

hh

L

h

hh

n = 58 unidades de amostra Logo, pelo critério da proporcionalidade, tem-se:

ESTRATO I: �� 11 nWn 53,11000.40

000.866,57 ��

121

�n unidades

ESTRATO II: 83,28000.40

000.2066,5722 �� nWn

292

�n unidades

ESTRATO III: 30,17000.40

000.1266,57

33�� nWn

3n = 18 unidades

f2) alocação ótima Dado que:

)()()()( 3

1

3

2

2

1

1 ysN

Nys

N

Nys

N

NysW

L

h

hh��

��

498227,25000.40

000.1280161,27

000.40

000.2073394,119

000.4

000.8)(

1

��

L

h

hh ysW

��

�L

h

hh ysW1

)( 6,3396948

110


Então:

9046526,50

000.40

49706,45031,28033767,1

3396948,6031,2

)(ˆ

])([

2

2

22

1

2

2

2

1

2

��

�

��

�

�

�

�

�

�

N

yVWt

E

ysWt

nL

h

hh

L

h

hh

n = 51 unidades de amostra.

Logo, pelo critério de otimização, têm-se:Estrato I:

57,173397,6

1885,290,50

)(

)(

1

11

1 ��

��

L

h

hh ysW

ysWnn

1n = 18 unidades de amostra.

Estrato II:

17,213397,6

6364,290,50

)(

)(

1

222 ��

��

L

h

hh ysW

ysWnn

2n = 22 unidades de amostra

Estrato III:

16,123397,6

5149,190,50

)(

)(

1

333 ��

��

L

h

hh ysW

ysWnn

3n = 13 unidades de amostra

g) discussão sobre a eficiência entre as alocações propor-cional e ótima

111


A seguir, far-se-á uma discussão sobre a eficiência entre as alocações ótima e proporcional. Para facilitar a análise, a Tabela 5.3 apresenta os resultados do dimensionamento dessas aloca-ções para o limite de erro de 10%, assim como uma coluna com os números de unidades medidas no inventário florestal referen-te ao limite de erro de 11,39%. A Tabela 5.4 mostra os valores das médias e das variâncias por estrato.

tabela 5.3 - Dimensionamento das alocações ótima e proporcional.

ESTRATOALOCAÇÃO

ÓTIMA (LE=10%)ALOCAÇÃO

PROPORCIONAL (LE=10%)Nº. UNID. MEDIDAS(LE=11,39%)

IIIIII

182213

122918

131512

TOTAL 53 59 40

tabela 5.4 - Médias e variâncias por estrato.

ESTRATO hy (m3/ha) )(ˆ yVh /ha

IIIIII

107,3675,1343,66

1915,7431 444,8257 407,9716

Considerando os resultados expostos, obtêm-se as se-guintes conclusões:

a) os resultados mostram que as médias dos estratos são muito diferentes entre si. Pode-se, então, concluir que a estrati-ficação foi eficiente, mesmo utilizando a alocação proporcional;

b) os resultados demonstram que há diferenças entre as variâncias dos estratos II e III em relação à variância do estrato I. Conclui-se, dada a existência de heterogeneidade de variâncias entre os estratos, que o emprego da alocação ótima resultará numa maior precisão em relação à utilização da alocação pro-porcional;

112


c) o exemplo ilustrativo acima exposto evidencia a maior precisão da alocação ótima, visto necessitar, para atender um limite de erro de LE = 0,10, de menos unidades de amostra que a alocação proporcional. Para atender ao limite de erro de LE = 0,10 e um nível de confiança de 0,95, deve-se, através da aloca-ção ótima, retornar ao campo e medir nos estratos I, II e III, res-pectivamente, mais 5, 7 e 1 unidades de amostra e, assim, totali-zar 53 unidades. Entretanto, se a opção fosse utilizar a alocação proporcional, haveria a necessidade de voltar ao campo e medir nos estratos II e III, respectivamente, mais 14 e 6 unidades de amostra e, assim, totalizar 60 unidades, visto que o estrato I foi superdimensionado em 1 unidade.

5.4 INVENTáRIO FLORESTAL APRESENTANDO SUBPOPULA-çõES COM DIFERENTES INTENSIDADES DE AMOSTRAGEM

Em levantamentos florestais, principalmente de áreas exten-sas, muitas vezes é necessário classificar subáreas de acordo com a sua importância tipológica ou estratégica, tal que determinados estratos sejam medidos com intensidades amostrais diferenciadas.

Seja o caso do Inventário Florestal Nacional (IFN) do Brasil que foi planejado para um grid de 20 km x 20 km. O processo de implantação dessa rede amostral na região Amazônica, pelas suas características diferenciadas, pode ser objeto de uma abor-dagem específica devido às condições naturais de acesso e de extensão territorial e, principalmente, em relação ao alto custo do levantamento.

A Amazônia Legal Brasileira abrange uma área de aproxi-madamente 5.217.423 km2 e estima-se que a floresta Amazô-nica ocorra em cerca de 3.300.000 km2. Então, considerando uma rede de unidades com distribuição sistemática segundo a

113


definição de um grid de 20 km x 20 km, pode-se obter aproxima-damente 8.250 pontos amostrais.

Havendo limitação de recursos financeiros para promover a medição de todos os 8.250 pontos da rede estabelecida, é imprescindível promover um estudo através de sensoriamento remoto, visando selecionar as áreas de acordo com suas prio-ridades em termos de grau de precisão. Por outro lado, uma variável importante, obviamente, será o custo médio por unidade de amostra por estrato. Este custo médio, evidentemente, está intimamente relacionado às dificuldades de acesso aos estratos.

Através de técnicas de sensoriamento remoto pode ser construído um mapa, o qual pode apresentar as estradas, rios navegáveis, pistas de pouso, organizações de apoio civis e mi-litares e outros. Este mapa deverá servir de base para delimitar as áreas (estratos) de acordo com o seu grau de dificuldade (acessibilidade ou outros atributos estratégicos), assim como em função dos custos. Havendo estratos com diferentes intensida-des de amostragem, o dimensionamento amostral e a análise estatística poderão ser realizados através da Amostra Estratifi-cada com Partilha ótima.

A estratificação da floresta com o objetivo de estabelecer estratos com diferentes intensidades de amostragem pode ser considerada como uma estratificação por razão administrativa, visto que não objetiva diretamente ganhar precisão ou tirar con-clusões sobre as características tipológicas.

exercício 5.2

Seja o exemplo em que os estudos sobre a acessibilidade e os custos médios de medição por estrato resultaram nas se-guintes decisões:

114


1) 40 % dos pontos da floresta Amazônica (estrato I) serão medidos segundo o grid definido de 20 km x 20 km;

2) os 60 % restantes serão classificados em três estratos (II, III, IV) e diferenciados em relação ao nível de acessibilidade e custos na medição das parcelas.

A partir de estudos de campo e bibliográfico, foram obtidas as seguintes informações acerca dos três estratos (II, III, IV). Ver Tabela 5.5.

tabela 5.5 - Dados por estrato: definição da intensidade de amostragem.

Estratos Wh sh (y) : (m3/ha) Ch hhh CysW /)(

II 0,5 11 1000 0,173925

III 0,3 9 3000 0,049295

IV 0,2 6 5000 0,016971

Total 1,0 0,240191

Wh é o peso do h-ésimo estrato; sh(y) é o desvio padrão do h-ésimo estrato;Ch é o custo médio de medição das parcelas no i-ésimo

estrato.Seja C= c1n1+c2n2+c3n3+c4n4 o custo total de medição, tal

que o componente c1n1 refere-se ao custo dos 40 % da floresta medido segundo o grid definido de 20 km x 20 km; o componente c2n2+c3n3+c4n4 refere-se à medição dos três estratos referentes aos 60 % da floresta que serão dimensionados a partir de graus de precisão diferentes.

Dado C= C’+ C’’.Tal que:C’ = c1n1; C”= c2n2+c3n3+c4n4.

115


Então, estabelecer o procedimento para definir os grid para os estratos II, III e IV, considerando os seguintes tamanhos de amostra n2, n3, e n4. O valor para n1 do estrato I já está definido em função do grid 20 km x 20 km.

Dado que:

∑=

=L

hhhh

hhhh

CysW

CysWnn

2

''

)/)((

/)( , sendo 432'' nnnn ++= .

Pela partilha da alocação ótima, têm-se:

''''

2

222''2 724111,0

240191,0

173925,0

)/)((

/)(nn

CysW

CysWnn

L

hhhh

===

∑=

''''

2

333''3 205233,0

240191,0

049295,0

)/)((

/)(nn

CysW

CysWnn

L

hhhh

===

∑=

''''

2

444''4 070654,0

240191,0

016971,0

)/)((

/)(nn

CysW

CysWnn

L

hhhh

===

∑=

Fixando-se o custo C’’, pode-se obter o valor de n’’ da se-guinte forma:

Substituindo, n2 = 0,724111n’’, n3 = 0,205233n’’ e n4 = 0,070654n’’, em C”= c2n2+c3n3+c4n4.

Tem-se:'''''''' 070654,05000205233,03000724111,01000 nnnC ××+××+××=

Portanto:

08,693.1

''

''C

n �

116


A partir do conhecimento do valor de n”, calcular n2, n3 e n4:

;724111,0 ''2 nn ×= ;205233,0 ''

3 nn ×=

.070654,0 ''4 nn ×=

Então, conhecendo-se as áreas dos estratos II, III, IV e os valores de n2, n3 e n4, é possível dimensionar os grid correspon-dentes aos estratos II, III e IV.

Outro procedimento para obter n’’ seria usar a fórmula 5.4 para ;4,3,2=h estabelecendo uma determinada semiamplitude de intervalo de confiança ( E = LE )estyLEE ×= .

�

� �

�

� �

�

�4

2

2

2

2

4

2

4

2

2

''

)/()((

h

hh

h h

hhhhhh

sWN

tE

CsWCsWt

n

cApítulo 6

AmostrAgem sIstemátIcA

Define a amostragem sistemática mostrando as diferen-ças, vantagens e desvantagens com relação à amostragem sim-ples ao acaso na aplicação em inventários florestais. Apresenta recomendações para obter a variância da média através de uma única amostra sistemática. Compara a precisão da amostragem sistemática em relação à amostra simples ao acaso. Mostra um exercício completo comparando várias alternativas para análise de um inventário florestal com amostragem sistemática.

119

Amostragem sistemática

A amostragem sistemática consiste em sortear uma uni-dade da população e, a partir dela, para constituir uma amostra de tamanho n, selecionar as unidades que ocupam de forma sequencial as posições múltiplas de um determinado valor K = N/n pré-estabelecido, onde N é o número de unidades total da população.

A amostragem sistemática apresenta uma diferença mar-cante com relação à amostragem simples ao acaso, no que tan-ge ao número de amostras possíveis.

Seja uma população composta por N unidades e n repre-sente o tamanho da amostra, sendo N = Kn. Se a amostragem for sistemática, o número de amostras possíveis é igual a K = N/n, enquanto que, em se tratando de uma amostra simples ao acaso sem reposição, o número de amostras possíveis (nap) será:

)!(!

!

nNn

NCnapn

N �

��

Então, teoricamente, uma amostra sistemática não pode

ser analisada como se fosse uma amostra simples ao acaso.A amostragem sistemática, quando comparada com a

amostra simples ao acaso, apresenta algumas vantagens, entre as quais:

a) a seleção das unidades amostrais, na amostragem sis-temática, é mais fácil e mais rápida;

b) a organização, a supervisão e a checagem (remedição) de algumas unidades da amostra se tornam operacionalmente mais fáceis;

c) o tamanho da população não precisa, necessariamente, ser conhecido;

d) as unidades da amostra sistemática se distribuem mais uniformemente na população, originando uma maior representa-

120


tividade, tornando-se eficiente quando existe qualquer tendência ou concentração de certas características;

e) a amostragem sistemática é mais eficiente quando se deseja mapear a floresta com relação à sua tipologia.

A grande desvantagem da amostra sistemática ocorre quando a população apresenta dados com características cícli-cas ou periódicas, pois, corre-se o risco da amostragem refletir homogeneidade numa condição sabidamente heterogênea.

A amostragem sistemática, considerando uma mesma grandeza amostral, poderá ter uma precisão maior que a amos-tra simples ao acaso, desde que haja grande heterogeneidade entre as unidades dentro das amostras sistemáticas possíveis.

Sob o ponto de vista teórico, a variância da média da amostra sistemática somente poderá ser obtida desde que se disponha dos valores médios de todas as amostras sistemáticas possíveis ou, então, sejam conhecidos os valores verdadeiros da variância da população V(y) e da variância entre as unidades dentro das amostras sistemáticas Vd (y), o que corresponde a ter que enumerar ou levantar a população totalmente, não sendo factível em termos de inventários florestais.

Havendo a impossibilidade de se obter a variância da mé-dia através de uma única amostra sistemática, pode-se, em rela-ção a levantamentos florestais, contornar o problema utilizando uma das seguintes recomendações:

a) de acordo com Campos (1981), quando as observações inerentes à variável resposta estão distribuídas aleatoriamente por algum critério objetivo ou mesmo ocorrem na floresta segun-do leis naturais, pode-se analisar uma amostra sistemática como inteiramente ao acaso;

b) pode-se, em vez de retirar uma única amostra de ta-manho n, número de unidades a serem medidas no inventário,

121


selecionar um determinado número k’ de amostras de tamanho n’, de tal forma que implique em n = k’ n’ e, através delas, obter uma estimativa para a variância da média;

c) a amostragem sistemática pode ser associada à amos-tragem por conglomerados, pois quando se subdivide uma po-pulação de tamanho N em K amostras sistemáticas de tamanho n, na verdade obtêm-se K grandes unidades conglomeradas. Assim, cada amostra sistemática pode ser considerada uma unidade conglomerada inteiramente casualizada, selecionada de uma população composta por K conglomerados. Portanto, havendo a seleção de uma amostra sistemática, pode-se esti-mar a variância )(yV através de )(ˆ yV , obtida da maneira usual, através da análise de uma amostra consistindo de apenas um conglomerado selecionado aleatoriamente. A amostragem por conglomerado está apresentada no capítulo 9.

Por outro lado, de acordo com as considerações contidas no item b, e adicionando-se o exposto no item c, pode-se con-cluir que há uma amostra consistindo de k’ conglomerados se-lecionados aleatoriamente, podendo-se estimar a variância da média utilizando a estrutura de análise específica por conglome-rados.

Em termos de inventários florestais, existe a concepção da amostragem com múltiplos inícios aleatórios, onde a estrutura amostral é uma amostragem sistemática em dois estágios, con-vergindo para um procedimento aleatório. Neste caso, a estru-tura estatística é similar à da amostragem por conglomerados, podendo-se proceder a uma análise de variância para se esti-mar os componentes de variância entre e dentro das faixas.

122


6.1 VARIâNCIA DA MÉDIA

Para formular os parâmetros da amostragem sistemática, utilizar-se-á a seguinte notação:

N = número total de unidades da população;K = número de amostras sistemáticas possíveis;n = número de unidades pertencentes a cada amostra sis-

temática;yij

= Valor da variável resposta correspondente à j-ésima

observação da i-ésima amostra sistemática.Seja a expressão da variância da média da amostra siste-

mática:

K

YyyV

K

ii

Sist

∑=

−= 1

2)()(

iy = média da i-ésima amostra sistemática. Y = média das médias das possíveis amostras sistemáti-

cas.Seja a fórmula da variância populacional:

1

)(

)( 1 1

2

−

−=∑∑

= =

N

Yy

yV

K

i

n

jij

Então:

∑∑= =

−−+=−K

i

n

jiiij YyyyyVN

1 1

2)()()1(

∑∑∑== =

−+−=−K

iii

K

i

n

jij YynyyyVN

1

22

1 1

)()()()1( , pois,

.0))((1 1

��

��K

i

n

j

iiij Yyyy

123


Portanto:

)()()1()()1(1

ynKVyVnyVN Sist

K

ii +−=− ∑

=

)()(

)1()()1( 1 ynKVK

yVnKyVN Sist

K

ii

+−=−∑

=

Por conseguinte:

)()1(

)()1

()( yVN

nKyV

N

NyV dSist

−+

−= – )(

)1()()

1()( yV

N

nKyV

N

NyV dSist

−+

−= (6.1)

Sendo: )(yVi = variância das observações dentro da i-ésima amos-

tra sistemática;

)(yVd = média das variâncias de todas as amostras siste-máticas possíveis.

A Fórmula 6.1 é similar às Fórmulas 6.2 e 6.3. A Expressão 6.2 é baseada na variância das médias de todas as amostras sistemáticas possíveis, enquanto a 6.3 está escrita em função do coeficiente de correlação ( Sistd ) entre pares de unidades que pertencem à mesma amostra sistemática.

1

)()()( 1

2

−

−−

=∑

=

K

Yy

N

nNyV

K

ii

Sist (6.2)

])1(1[)(

)1

()( SistSist nn

yV

N

NyV d−+

−= (6.3)

Tal que:

)()1)(1(

)()1()1(

)(

))((

2 yVnKn

yVKnnQMK

YyE

YyYyEEntre

ij

iuij

Sist��

��

�

��

124


Na expressão do Sistd , o numerador representa a média de todos os Kn(n-1) / 2 pares diferentes de unidades e o denomina-dor é a média de todos os Kn valores de yij. No capítulo sobre amostragem por conglomerados há mais informações sobre o coeficiente de correlação Sistd .

Como anteriormente observado, o grande inconveniente das Fórmulas 6.1, 6.2 e 6.3 é que se deve conhecer a variância ver-dadeira da população e a variância verdadeira entre as unidades dentro das amostras sistemáticas possíveis ou os valores médios verdadeiros. Entretanto, pode-se, com referência aos inventários florestais, utilizar os argumentos expostos no início deste capítulo.

6.2 PRECISãO DA AMOSTRA SISTEMáTICA COMPARADA À AMOSTRA SIMPLES AO ACASO

Sejam as fórmulas:a) variância da média da amostra simples ao acaso

n

yV

N

nNyVAsa

)()()(

−=

b) variância da média da amostra sistemática

)()1(

)()1

()( yVN

nKyV

N

NyV dSist

−−

−=

A amostra sistemática será mais precisa que a amostra

simples ao acaso, se:)()( yVyV AsaSist <

Logo:

n

yV

N

nNyV

N

nKyV

N

Nd

)()()(

)1()()

1(

−<

−−

−

125


Desenvolvendo, onde N = nK, tem-se:

n

yV

N

nyV

nK

nKyV

Nd

)()1()(

)1()()

11( ��

�

��

N

yV

n

yVyV

n

n

N

yVyV d

)()()(

)1()()( −<

−−−

)())1(

()(

)( yVn

n

n

yVyV d

−<−

V (y)( )()1

()1

)(( yVn

n

n

nyV d

−<

−

Sendo:

)()( yVyVd >

Concluindo-se que a maior heterogeneidade entre as uni-dades dentro das amostras sistemáticas resulta numa maior pre-cisão em relação às amostras simples ao acaso.

exercício 6.1

Seja uma área florestal com 250 ha, dividida em 1.000 uni-dades de 0,25 ha. Os dados amostrais foram retirados de uma população, simulada computacionalmente, com média e variân-cias conhecidas:

A Tabela 6.1 apresenta a análise de variância populacional.

tabela 6.1 - Análise de variância populacional.

CV GL SQ QM

Amostras (K) 19 1503,0 79,1053

Erro 980 136.158,0 138,9367

Total 999 137.661,0 137,7988

126


)25,0/(106,38 3 hamY �23 )25,0/(7988,137)( hamyV �

23 )25,0/(9367,138)( hamyVd �

1) Retirar uma amostra sistemática de 50 unidades e obter a variância da média pelas seguintes expressões:

)()1(

)()1

()( yVN

nKyV

N

NyV dSist

−−

−=

1

)()()( 1

2

−

−−

=∑

=

K

Yy

N

nNyV

K

ii

Sist

])1(1[)(

)1

()( SistSist nn

yV

N

NyV d−+

−=

2) Considerar os dados do item anterior (amostra sistemá-tica de 50 unidades) e obter a variância da média como se fosse inteiramente ao acaso (ASA).

n

yV

N

nNyVsist

)(ˆ)()(ˆ

2

−=

3) Retirar da população cinco amostras sistemáticas com 10 unidades cada e obter a variância da média por meio da ex-pressão da amostragem por conglomerados. Ver capítulo 9.

mn

yVff

n

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

211

13 ��

4) Dividir a população em vinte subpopulações com 50 uni-dades cada, sortear sistematicamente cinco delas e, em cada

127


uma, selecionar uma amostra sistemática de 10 unidades. Obter a variância da média pela expressão da Amostragem por Con-glomerados. Ver capítulo 9.

mn

yVff

n

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

211

13 ��

5) Retirar da população uma amostra aleatória de 50 uni-dades e obter a variância da média.

n

yV

N

nNyVAsa

)(ˆ)()(ˆ

4

−=

6) Discutir e concluir sobre os resultados

1) variância da média da amostra sistemática de 50 uni-dades pelas expressões (variâncias conhecidas)

)()1(

)()1

()( 1 yVN

nKyV

N

NyV dSist

−−

−=

tabela 6.2 - Dados da amostra sistemática de tamanho n = 50.

26,4 68,1 17,4 35,7 47,1 33,6 43,2 43,4 44,7 31,032,4 37,6 35,4 18,0 42,0 15,7 36,3 36,5 34,7 42,343,0 32,5 34,7 48,0 34,4 55,6 37,1 39,7 42,5 45,832,3 57,0 29,9 30,7 54,5 32,1 41,8 48,3 19,3 56,651,2 40,4 41,0 36,1 31,4 37,5 31,9 38,5 41,7 29,3

Dado que:

2050

000.1 ��n

NK

19161∑

=

=n

iiy

23)25,0/(7988,137)( hamyV �

128


Então:

hamn

y

y

n

i

i

/32,3850

1916 31

1��

��

hamyVSist 25,0/503,19367,138000.1

)150(207988,137

000.1

1000.1)(

3

1 ��

��

�

1

)(

)(

1

)(

)()(

2

1

1

2

1

2

1�

��

��

��

�

��

��

K

K

y

y

N

nN

K

Yy

N

nNyV

K

i

iK

i

i

K

i

i

Sist

tabela 6.3 - Médias das K = 20 amostras sistemáticas.

35,690 37,042 38,140 39,274 38,266 37,22 37,596 38,134 38,844 39,144

40,464 38,828 38,448 35,342 37,648 39,66 39,196 38,244 37,99 36,946

Da Tabela 6.3 pode-se obter:

116,7621

��

�K

i

iy

09696,071.291

2

��

�K

i

iiy

Então:

503,119

20

116,76209696,071.29

)000.1

50000.1(

1

)(

)()(

2

2

1

1

2

1 �

�

��

��

��

�

��

�

K

K

y

y

N

nNyV

K

i

iK

i

i

Sist

])1(1[)(

)1

()( 1 Sis tSist nn

yV

N

NyV ��

��

)()1)(1(

)()1()1(

yVnKn

yVKnnQMKEntre

Sist��

��

129


Da Tabela 6.1 pode-se obter:

059,389.745.6

9662,510.62

7988,137)150)(15020(

7988,137)15020(1053,7950)120( ��

��

��Sist�

380092672143,0059,389.745.6

9662,510.62��

��Sis t�

]80092672143,0)(150(1[50

7988,137)

000.1

1000.1()(

1��

��yV

Sist

23

1 )25,0/5030,1)( hamyVSist �

Conclui-se que os resultados comprovam a semelhança das três fórmulas.

2) variância da média da amostra sistemática de 50 uni-dades, analisada como inteiramente ao acaso (AsA)

n

yV

N

nNyVSist

)(ˆ)()(ˆ

2

−=

Pode-se obter da Tabela 6.2:

hamn

y

y

n

i

i

/32,3850

1916 31

2 ��

��

23

2

2

1

1

2

)25,0/(6693,10749

50

3,191691,719.78

1

)(

)(ˆ hamn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

Então:23

2 )25,0/(0457,250

6693,107)

000.1

50000.1(

)(ˆ)()(ˆ ham

n

yV

N

nNyVSist �

�

�

�

�

130


3) variância da média para as cinco amostras sistemá-ticas com 10 unidades (Amostragem por conglomerados)

Da população de N = 1.000 foram selecionadas sistemati-camente cinco amostras com 10 unidades. Neste caso K = 100.

tabela 6.4 - Dados das cinco amostras sistemáticas.

A1 A2 A3 A4 A51 47,1 37,6 26,6 36,7 48,92 31,0 46,0 52,6 38,8 72,23 42,0 48,1 39,9 24,3 34,34 42,3 21,4 34,9 34,8 50,65 34,4 48,3 40,5 58,2 35,76 45,8 47,2 24,7 28,1 37,27 54,5 44,1 46,1 51,4 58,18 56,6 13,5 35,0 30,4 35,89 31,4 27,3 69,6 55,3 46,5

10 29,3 38,6 33,9 48,7 53,0

iy 41,44 37,21 40,38 40,67 47,23

)(ˆ yVi 95,47 153,17 174,76 142,90 146,78

km

yVff

k

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

211

13 ��

Sendo: m = 10 e k = 5.

hamk

y

y

k

i

i

/386,415

93,206 31

3��

��

131


tabela 6.5 - Análise de variância estimada por conglomerados.

CV GL SQ QM

Entre 4 531,1892 132,7973

Dentro 45 6417,6910 142,6154

Total 49 6948,8802 141,8139

1

)(

1

)()(ˆ

2

1

1

2

1

2

1 −

−=

−

−=

∑∑∑ =

==

kk

yy

k

yyyV

k

iik

ii

k

ii

23

2

1 )25,0/(27973,134

5

93,2061239,617.8

)(ˆ hamyV �

�

�

Note-se que:

23

1 )25,0/(27973,1310

7973,132ˆ)(ˆ ham

m

MQyV Entre

��

231

2

1

2 )25,0/(616,142)1(

)(

)(ˆ hammk

yy

yV

k

i

i

m

j

ij

��

�

�

��

616,142146,78)90,14276,174153,1747,95(5

1)(ˆ

)(ˆ 1

2��

��

k

yV

yV

n

i

i

Dado:

;50�M ;20�K ;25,020

51

��K

kf 5,0

50

102

��M

mf

132


Então:

23

3 )25,0/(3485,2510

6154,142)5,01(25,0

5

27973,13)25,01()(ˆ hamyV �

�

��

4) variância da média para as cinco subpopulações com 10 subparcelas (Amostragem por conglomerados)

A população de N = 1.000 foi dividida em K = 20 subpopu-lações de 50 unidades e numeradas de 1 a 20. Foram seleciona-das as subpopulações: 2, 6, 10, 14 e 18 e dentro de cada foram retiradas sistematicamente 10 unidades.

km

yVff

k

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

211

14 ��

tabela 6.6 - Dados considerando cinco subpopulações.

A1 A2 A3 A4 A51 24,5 23,8 40,6 34,0 39,62 17,4 35,4 34,7 29,9 41,03 22,6 46,2 44,3 38,1 49,54 31,5 49,6 32,1 28,9 16,55 50,0 60,3 44,4 28,4 51,46 35,7 18,0 48,0 30,7 36,17 43,9 42,8 33,8 21,8 29,38 41,7 28,8 30,3 26,7 48,79 20,3 40,0 28,4 38,7 42,5

10 47,1 42,0 34,4 54,5 31,4

iy 33,47 38,69 37,10 33,17 38,6

)(ˆ yVi 141,63 158,93 45,23 82,16 115,51

133


tabela 6.7 - Análise de variância estimada por conglomerados.

CV GL SQ QMEntre 4 294,04 73,531

Dentro 45 4891,25 108,690Total 49 5185,29 105,820

Dado: k = 5 e m = 10.

Da Tabela 6.6, tem-se:

hamkm

y

y

n

i

i

/206,3650

3,1810 31

4 ��

��

1

)(

1

)(

)(ˆ

2

1

1

2

1

2

1�

�

��

�

�

��

�

��

k

k

y

y

k

yy

yV

k

i

ik

i

i

k

i

i

23

2

1)25,0/(3509,7

4

5

03,1817759,583.6

)(ˆ hamyV �

�

�

Observar, considerando as aproximações, que:

23

1)25,0/(3531,7

10

531,73ˆ)(ˆ ham

m

MQyV Entre ��

231

2

1

2 )25,0/(69,108)1(

)(

)(ˆ hammk

yy

yV

k

i

i

m

j

ij

��

�

�

��

108,69115,51)82,1645,23158,93141,63(5

1)(ˆ

)(ˆ 1

2 ��

��

k

yV

yV

n

i

i

134


Dado: 50�M , 20�K

25,020

51 ��

K

kf e 5,0

50

102

��

M

mf . Então:

234 )25,0/(3747,1

510

692,108)5,01(25,0

5

3531,7)25,01()(ˆ hamyV �

�

��

5) variância da média da amostra aleatória de 50 uni-dades

n

yV

N

nNyVAsa

)(ˆ)()(ˆ

4

−=

tabela 6.8 - Dados da amostra aleatória de tamanho n = 50.

28,2 38,5 25,7 23,8 32,7 21,1 41,1 54,5 24,9 24,232,3 22,4 47,6 38,8 26,7 36,9 26,7 36,2 30,9 15,926,7 37,2 21,4 43,0 23,8 38,2 50,5 26,2 27,3 16,645,5 36,3 39,3 30,1 64,2 34,2 61,0 47,6 32,5 46,538,2 38,4 34,8 51,0 37,6 23,4 24,0 30,7 19,3 54,5

Considerando os dados da Tabela 6.8, tem-se:

hamyAsa /582,3450

1,1729 3��

5770,12849

50

1,172901,096.66

1

)(

)(ˆ

2

2

1

1

2

�

�

��

�

�

��

�

n

n

y

y

yV

n

i

in

i

i

Portanto:23

4 )/(4430,250

5770,128

1000

501000)(ˆ)()(ˆ ham

n

yV

N

nNyVAsa ��

�

�

�

�

135


6) discutir e concluir sobre os resultados

tabela 6.9 - Médias e variâncias da média considerando os cinco casos.

Casos Procedimentos Médias Variâncias da média

1 Variâncias conhecidas 38,32 1,5030

2 Análise como ASA 38,32 2,0457

3 Conglomerados 41,39 2,3485

4 Conglomerados (Subpopulações) 36,21 1,3747

5 Amostra aleatória 34,58 2,4430

Este exemplo foi planejado a partir de uma população co-nhecida, para:

hamY 25,0/11,383�

23 )/(7988,137)( hamyV �23

)/(9367,138)( hamyVd �

Sendo a variância da média populacional para a amostra de 50 unidades igual a 1,5030, verifica-se que a análise por con-glomerados apresentou o valor mais próximo (1,3747). A amos-tra aleatória apresentou o maior valor (2,4430), sendo 62,54 % maior que 1,5030. Este resultado é devido existir maior hetero-geneidade entre as unidades dentro das amostras sistemáticas, o que denota uma maior precisão em relação à amostra simples ao acaso, ou seja: )()( yVyVd > .

Conclui-se, neste caso, que o uso da amostragem sistemá-tica é mais recomendável.

cApítulo 7

estImAtIvAs por rAzão

Define a estimativa por razão descrevendo os parâmetros populacionais e os seus estimadores, assim como mostra sua importância na aplicação em inventários florestais apresentan-do casos em que é comum obter a estimativa de uma variável resposta associada a uma variável auxiliar. Apresenta as meto-dologias para obter as estimativas por razão com igual probabi-lidade; com probabilidade proporcional à variável auxiliar; com amostragem inversa com probabilidade proporcional à variável auxiliar. Aborda a estimativa por razão considerando a amostra-gem estratificada. Trata do uso da dupla amostragem com fases dependentes para melhorar a precisão da estimativa. Aborda como comparar dois índices ou duas razões. Mostra vários exer-cícios aplicativos comparando várias alternativas de análise em inventários florestais.

139

Estimativa por razão

Nos levantamentos por amostragem, geralmente, ocorrem casos em que há a necessidade de se obter a estimativa da relação entre duas variáveis aleatórias y e x, normalmente cor-relacionadas para cada unidade de amostra. Pode-se, também, obter a estimativa de uma variável y associada à variável x, po-dendo acontecer que x seja a mesma característica y medida em uma ocasião anterior. O interesse da aplicação da estimativa por razão é obter as informações seguintes:

a) a estimativa da razão R entre as variáveis y e x;b) a estimativa da média por razão ( Ry ), obtida através de

uma variável auxiliar x;c) a estimativa do valor total da população por razão (

RY ), obtida através de uma variável auxiliar x.

O objetivo mais importante do emprego da estimativa por razão é obter maior precisão no cálculo das estimativas dos pa-râmetros utilizando o grau de correlação existente entre y e x, principalmente quando os valores de yi e xi não sofrem grandes variações entre as unidades de amostra, e o tamanho da amos-tra é superior a 30 unidades.

7.1 ESTIMATIVAS POR RAzãO COM IGUAL PROBABILIDADE

a) estimativa da variância de

Para formular os parâmetros e estimadores, utilizar-se-á a seguinte notação:

Y = valor médio populacional da variável de interesse y;y = valor médio amostral da variável de interesse y;Y = valor total populacional da variável de interesse y;Y = valor total amostral da variável de interesse y;X = valor médio populacional da variável auxiliar x;

140


x = valor médio amostral da variável auxiliar x;X = valor total populacional da variável auxiliar x;X = valor total amostral da variável auxiliar x;

Ry = estimativa da média por razão da variável de interes-se y;

RY = estimativa do valor total da população por razão da variável de interesse y.

Seja a fórmula do valor populacional da razão entre as va-riáveis y e x e do seu estimador, respectivamente:

X

Y

X

YR == ;

y

x

Y

XR ==

ˆ

ˆˆ .

Sob o ponto de vista teórico, o método da estimativa por razão apresenta o inconveniente de que a estimativa R é um quociente entre duas variáveis aleatórias, tornando a sua distri-buição desconhecida e complexa.

Não obstante, Cochran (1977) cita que para pequenas amos-tras a distribuição de R é assimétrica, onde R é uma estimativa tendenciosa de R. Entretanto, para grandes amostras (n >30), a distribuição de R tende à distribuição normal, tornando a ten-dência estatística praticamente desprezível. O ideal é que o va-lor médio populacional X da variável auxiliar seja conhecido.

Seja o desvio RR −ˆ . Então: x

xRyR

x

yRR

−=−=−ˆ .

Considerando para fins aplicativos que Xx = . Então:

X

xRyRR

−≅−ˆ

Queiroz (1998) citou que, geralmente, em inventários de florestas naturais se desconhece o valor médio X populacio-nal da variável auxiliar, sendo mais provável conhecê-lo para florestas plantadas, recomendando, então, para fins aplicativos,

141


tomar xX = para grandes amostras (n >30), desde que não haja heterogeneidade entre os valores dos coeficientes de variação de xX = e Ry (<10%).

Da definição de variância 2)ˆ()ˆ( RRERV −= , portanto:

22

2 )(1

)()ˆ( xRyEXX

xRyERV −=

−≅

Dado que:

dn

d

n

xRy

n

xRyxRy

n

ii

n

iii

n

i

n

iii

==−

=−

=−∑∑∑ ∑

== = 11 1

)(, para iii xRyd −=

Se ,iii xRyd −= logo:

1

)()(

2

1

−

−=∑

=

N

DddV

N

ii

i

Como .0)()( ==−=−= DXRYxRyEdE , então:

1

)(

1)(

2

11

2

−

−=

−=

∑∑==

N

xRy

N

ddV

N

iii

N

ii

i

Se n

dd

n

ii∑

== 1 , então:

1

)(

)()(

)()( 1

2

�

��

��

�

��

N

xRy

Nn

nN

n

dV

N

nNdV

N

i

ii

i

Dado que 2)]([)( dEdEdV −= )]2, mas como:

0)()( =−=−= XRYyRxEdE , tem-se:

142


22 )()()( xRyEdEdV −==

Dado que ,)(1

)ˆ( 22

xRyEX

RV −≅ então:

1

)(

)()(1

)ˆ( 1

2

22 �

��

��

��

N

xRy

XnN

nNdV

XRV

N

i

ii

Sendo sua estimativa dada por:

1

ˆˆ2

)()ˆ(ˆ 1

22

11

2

2 �

��

�

��

n

xRyxRy

XnN

nNRV

n

i

i

n

i

ii

n

i

i

Esta expressão também pode ser escrita da seguinte forma:

)],(ˆˆ2)(ˆˆ)(ˆ)[()ˆ(ˆ 2

2yxVRxVRyV

XnN

nNRV ��

�

�

Tal que:

;1

)(

)(ˆ

2

1

1

2

�

�

�

��

�

�

n

n

x

x

xV

n

i

in

i

i

;1

)(

)(ˆ

2

1

1

2

�

�

�

��

�

�

n

n

y

y

yV

n

i

in

i

i

1

))((

),(ˆ

11

1

�

�

�

��

��

�

n

n

yx

yx

yxV

n

i

i

n

i

in

i

ii

.

),(ˆ yxV é a covariância entre x e y.

b) intervalo de confiança para a razão (R)

Para o caso de grandes amostras (n > 30) e admitindo-se que R tem distribuição normal, o intervalo de confiança é dado por:

143


)]ˆ(ˆ[2

RstRIC�

�� , onde )ˆ(ˆ)ˆ( RVRs � .

c) estimadores da média, do total e suas variâncias

Conhecida a média populacional X da variável auxiliar é possível, através da estimativa por razão, obter a estimativa do valor total e do valor da média da população para a variável res-posta de interesse y.

Dado quex

y

X

YR ==

ˆ

ˆˆ , então XRyR

ˆ= e ).ˆ(ˆ)(ˆ 2 RVXyV R = ).

Assim como:

XNRXRYRˆˆˆ == e )ˆ(ˆ)ˆ(ˆ 22 RVXNYV R =

d) intervalo de confiança para a média Y e para o valor total Y

Considerando grandes amostras (n > 30) e admitindo-se que R tem distribuição normal, têm-se:

)]ˆ(ˆ[)(22

RstRXystyIC RR ��

)]ˆ(ˆ[)]([)ˆ(ˆ

222

RstRXNystyNYstYIC RRRR ��

exercício 7.1

Seja o inventário florestal de uma área de 3.574,00 ha per-tencente à Fazenda Santa Lúcia, localizada no município de Pau D’arco, estado do Pará, realizado por Borges (1990) e analisado

144


por Queiroz (1998). Os dados foram obtidos através da medição de 30 unidades de uma amostra simples ao acaso e mostrados na Tabela 7.1. A estrutura da unidade de amostra apresentou uma forma retangular de 10 m de largura e 250 m de comprimento, onde foram mensuradas todas as árvores com 45≥DAP 45 cm. Ana-lisar os dados através da amostragem por razão com igual proba-bilidade (AIP).

tabela 7.1 - Estimativa por razão com igual probabilidade (AIP).

UA xi yi UA xi yi UA xi yi

1 6 13,0 11 5 16,5 21 10 30,52 4 16,1 12 4 17,1 22 7 14,73 4 9,7 13 6 17,6 23 8 19,04 5 20,1 14 9 24,0 24 6 19,75 9 29,6 15 5 16,7 25 6 18,46 8 23,4 16 5 21,9 26 8 25,47 5 21,9 17 3 10,4 27 8 18,68 4 17,5 18 5 10,0 28 6 18,99 8 22,1 19 4 14,5 29 9 28,3

10 5 12,8 20 7 29,7 30 7 22,0

a) informações iniciais sobre volume e número de árvores na amostra

yi = volume em m3/0,25 haxi = número de árvores/0,25 ha

��

�30

1

10,580i

iy m3; �

�

�30

1

186i

ix árvores

a1) valor médio para a variável auxiliar número de árvores

haárvores

x

xi

i

25,0/2,630

186

30

30

1��

��

145


a2) valor médio para a variável de interesse (volume)

ham

y

y i

i

25,0/3367,1930

10,580

30

3

30

1 ��

��

Portanto:hamy /3467,77

3�

b) estimativa da razão

árvoremx

yR /1188,3

186

10,580ˆ 3��

c) cálculo da estimativa da variância de RDado que:N = 3574 / 0,25 = 14.296

6748,3229

30

10,58077,164.12

1

)(

)(ˆ

2

2

1

1

2

�

�

��

�

�

��

�

�

n

n

y

y

yV

n

i

in

i

i

4759,329

30

1860,254.1

1

)(

)(ˆ

2

2

1

1

2

�

�

��

�

�

��

�

�

n

n

x

x

xV

n

i

in

i

i

0752,829

30

10,5801868,830.3

1

))((

),(ˆ

11

1�

��

��

�

�

��

�

n

n

yx

yx

yxV

n

i

i

n

i

in

i

ii

Então:

)],(ˆˆ2)(ˆˆ)(ˆ)[()ˆ(ˆ 2

2yxVRxVRyV

XnN

nNRV ��

�

�

)0752,81188,324759,31188,36748,32)(2,6296.1430

30296.14()( 2

2��

��

��

��

RV

23 )/(01394458,0)( árvoremRV �

��

146

Amostragem em inventário florestal Waldenei Travassos de Queiroz)],(ˆˆ2)(ˆˆ)(ˆ)[()ˆ(ˆ 2

2yxVRxVRyV

XnN

nNRV ��

�

�

)0752,81188,324759,31188,36748,32)(2,6296.1430

30296.14()( 2

2��

��

��

��

RV

23 )/(01394458,0)( árvoremRV �

��

Considerando o desconhecimento do valor populacional

do número de árvores X , utilizou-se haárvoresxX 25,0/2,6== 0,25 ha.

d) estimativa do erro padrão de R

árvoremRVRs /1181,0013944584,0)ˆ(ˆ)ˆ( 3===

e) intervalo de confiança para R

Seja “t = 2,0452” o valor da distribuição de “Student” com 29 graus de liberdade para o nível de significância a=0,05. Então:

Limite inferiorárvoremRstR /8773,21181,00452,21188,3)ˆ(ˆ 3=×−=×−

Limite superiorárvoremRstR /3603,31181,00452,21188,3)ˆ(ˆ 3=×+=×+

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor verdadeiro ou paramétrico da razão encontra-se no intervalo de 2,8773 a 3,3603.

f) estimativa da média do volume Ry e sua variância )(ˆRyV

hamXRy R 25,0/34,192,61188,3ˆ 3�� , tal que: hamyR /35,77 3

�

2322)25,0/(536029655,001394458,02,6)ˆ(ˆ)(ˆ hamRVXyV R ��

232 )/(576474,85014,04)(ˆ hamyVR

��

147


Adotou-se:

haárvoresxX /2,630

186 ��

g) erro padrão da média

hamhayVys RR /928562,2/)(ˆ)(3��

h) estimativas do total RY e sua variância )ˆ(ˆRYV

34618,435.2762,614.2961188,3ˆˆ mXNRY

R��

232222)(0,391.551.10901394458,02,6296.14)ˆ(ˆ)ˆ(ˆ mRVXNYV

R��

i) erro padrão do total368,466.10)ˆ(ˆ)ˆ( mYVYs

RR��

j) intervalo de confiança para o valor médio Y

Limite inferior/hahamysty

RR/36,71928562,20452,235,77)(

3��

Limite superior/hahamysty

RR/34,83928562,20452,235,77)(

3��

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 71,36 m3/ ha a 83,34 m3/ ha.

k) intervalo de confiança para o valor total Y

Limite inferior 301,029.25568,466.100452,246,435.276)ˆ(ˆ mYstY

RR��

148


Limite superior 3

91,841.29768,466.100452,246,435.276)ˆ(ˆ mYstYRR

��

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 255.029,01 m3/ ha a 297.841,91 m3/ ha.

l) limite de erro para a estimativa por razão

%74,710035,77

928562,20452,2100

)(��

�

��

�

�

R

R

Ry

ystLE

m) cálculo da variância da média sem considerar a variável auxiliar (número de árvores)

23)25,0/(0869,1)

296.14

30296.14(

30

6748,32)(

)(ˆ)(ˆ ham

N

nN

n

yVyV �

�

�

�

�

23)/(39,17)(ˆ hamyV �

hamhayVhays /1701,439,17/)(ˆ/)(3

��

n) limite de erro sem considerar a variável auxiliar (número de árvores)

%03,1110035,77

1701,40452,2100

)(��

�

��

y

ystLE

SV

o) estimativa da eficiência da estimativa por razão Considerando a definição de eficiência como o quociente

entre o limite de erro sem considerar a variável auxiliar número de árvores e o limite de erro estimado pelo método da razão, tem-se:

46,1 42%74,7

%03,11 ��R

SV

LE

LEEf

149


Os resultados mostram um limite de erro de 11,03 %, não considerando na análise a variável auxiliar número de árvores por parcela. Este limite de erro corresponde a um valor 42,46 % maior que o estimado pelo método por razão (7,74 %), demons-trando que esta estimativa apresenta uma eficiência superior àquela.

Dado que:

7.2 ESTIMATIVAS POR RAzãO CONSIDERANDO PROBABI-LIDADE PROPORCIONAL (AAP) À VARIáVEL AUxILIAR (x)

Considera-se na seleção de uma amostra, normalmente, que todos os elementos da população sejam igualmente prová-veis de serem escolhidos. Na estimativa por razão, em alguns casos, é usual selecionar a amostra com probabilidade propor-cional aos valores da variável auxiliar x. Neste método, o peso de cada elemento é considerado na seleção, visto que a ocor-rência dos mesmos não é igualmente provável.

Este procedimento produz estimativas não tendenciosas para média, valor total e suas respectivas variâncias. Não há correção para população finita por tratar-se de uma amostragem com reposição.

Seja n

RR

n

ii∑

== 1ˆ o estimador não tendencioso de .1

N

RR

N

Ii∑

==

Convém salientar que a razão média R , que é uma média ponderada dos iii xyR = , difere da média das razões .R Ou seja:

)()( yLEyLE SVR � , ou seja,4246,1

)()(

yLEyLE SV

R�

150


Rx

RxR

n

ii

N

Iii

ˆˆ

1

1 ≠=

∑

∑

=

=

Dado que 1

)(

1

)ˆ()(ˆ 1

2

122

1

−

−=

−

−=

∑∑

∑=

=

=

nn

RR

n

RRRV

n

i

n

ii

i

n

Ii

i. Então:

n

RVRV i )(ˆ

)ˆ(ˆ =

A partir da estimativa n

RR

n

ii∑

== 1ˆ , pode-se obter:

;RXyR = XRNyNY RRˆˆ == e suas respectivas variâncias:

);ˆ(ˆ)(ˆ 2 RVXyV R = )ˆ(ˆ)(ˆ)ˆ(ˆ 222 RVXNyVNYV R ==

exercício 7.2

Seja uma área florestal populacional de 100 ha com ocor-rências de 405 árvores matrizes. O objetivo é monitorar a produ-ção de sementes de uma determinada espécie florestal. A área está subdividida em 100 subáreas (Unid) de 1 ha. As 405 matri-zes da espécie em estudo estão perfeitamente localizadas em um mapa logístico. A Tabela 7.2 apresenta os dados: número de árvores por unidade de 1 ha (x) e a numeração sequencial para as 405 árvores. A Tabela 7.3 apresenta os dados sobre a produção de semente em kg por Unid para uma amostra de 50 árvores. Analisar os dados através da amostragem com Proba-bilidade Proporcional à x (APP).

151


tabela 7.2 - Número de árvores para as 100 unidades de 1 ha (Unid).

Unid x Num Unid x Num Unid x Num

1 4 1 a 4 34 2 133 a 134 67 4 267 a 270

2 4 5 a 8 35 3 135 a 137 68 5 271 a 275

3 3 9 a 11 36 4 138 a 141 69 4 276 a 279

4 3 12 a 14 37 4 142 a 145 70 3 280 a 282

5 7 15 a 21 38 4 146 a 149 71 6 283 a 288

6 5 22 a 26 39 7 150 a 156 72 5 289 a 293

7 3 27 a 29 40 4 157 a 160 73 2 294 a 295

8 4 30 a 33 41 3 161 a 163 74 5 296 a 300

9 3 34 a 36 42 4 164 a 167 75 3 301 a 303

10 4 37 a 40 43 5 168 a 172 76 4 304 a 307

11 4 41 a 44 44 4 173 a 176 77 4 308 a 311

12 3 45 a 47 45 7 177 a 183 78 5 312 a 316

13 5 48 a 52 46 4 184 a 187 79 2 317 a 318

14 6 53 a 58 47 4 188 a 191 80 4 319 a 322

15 2 59 a 60 48 3 192 a 194 81 3 323 a 325

16 5 61 a 65 49 2 195 a 196 82 3 326 a 328

17 4 66 a 69 50 3 197 a 199 83 5 329 a 333

18 4 70 a 73 51 4 200 a 203 84 5 334 a 338

19 5 74 a 78 52 5 204 a 208 85 5 339 a 343

20 3 79 a 81 53 4 209 a 212 86 3 344 a 346

21 4 82 a 85 54 5 213 a 217 87 3 347 a 349

22 4 86 a 89 55 4 218 a 221 88 4 350 a 353

23 3 90 a 92 56 4 222 a 225 89 4 354 a 357

24 5 93 a 97 57 5 226 a 230 90 6 358 a 363

25 3 98 a 100 58 6 231 a 236 91 6 364 a 369

26 5 101 a 105 59 4 237 a 240 92 2 370 a 371

27 4 106 a 09 60 3 241 a 243 93 7 372 a 378

28 4 110 a 113 61 1 244 94 2 379 a 380

29 3 114 a 116 62 6 245 a 250 95 5 381 a 385

30 4 117 a 120 63 5 251 a 255 96 3 386 a 388

31 4 212 a 124 64 4 256 a 259 97 4 389 a 392

32 5 125 a 129 65 4 260 a 263 98 6 393 a 398

33 3 130 a 132 66 3 264 a 266 99 3 399 a 401

100 4 402 a 405

152


tabela 7.3 - Produção em kg de sementes (yi) por Unid amostrada.

Árvore Unid xi yi i

ii x

yR = Árvore Unid xi yi i

ii x

yR =

24 6 5 16,15 3,23000 254 63 5 12,20 2,4400036 9 3 10,53 3,51000 261 65 4 12,58 3,1450037 10 4 8,50 2,12500 262 65 4 12,58 3,1450039 10 4 8,50 2,12500 276 69 4 13,13 3,2825049 13 5 11,90 2,38000 278 69 4 13,13 3,2825091 23 3 9,07 3,02333 279 69 4 13,13 3,28250111 28 4 13,23 3,30750 285 71 6 14,39 2,39833120 30 4 11,48 2,87000 288 71 6 14,39 2,39833127 32 5 14,71 2,94200 291 72 5 14,58 2,91600128 32 5 14,71 2,94200 293 72 5 14,58 2,91600136 35 3 10,95 3,65000 297 74 5 14,14 2,82800138 36 4 15,31 3,82750 303 75 3 11,94 3,98000144 37 4 11,26 2,81500 312 78 5 12,37 2,47400148 38 4 11,73 2,93250 323 81 3 11,03 3,67667153 39 7 16,42 2,34571 325 81 3 11,03 3,67667165 42 4 12,57 3,14250 334 84 5 12,71 2,54200175 44 4 10,88 2,72000 336 84 5 12,71 2,54200189 47 4 13,03 3,25750 349 87 3 8,93 2,97667199 50 3 11,11 3,70333 362 90 6 15,75 2,62500200 51 4 10,28 2,57000 371 92 2 10,71 5,35500203 51 4 10,28 2,57000 372 93 7 15,01 2,14429208 52 5 13,14 2,62800 376 93 7 15,01 2,14429229 57 5 13,44 2,68800 394 98 6 13,76 2,29333233 58 6 14,14 2,35667 398 98 6 13,76 2,29333240 59 4 15,40 3,85000 400 99 3 8,19 2,73000Total 223 630,46 146,9990

a) média das razões ( R )

árvorekgn

R

R

n

i

i

/94,250

9990,146ˆ 1��

��

153


b) variância de R

2

2

1

2

12

)/(3735,049

50

999,1464753,450

1

)(

)(ˆ árvorekgn

n

R

R

RV

n

i

n

i

i

i

i �

�

��

�

�

��

�

�

2)/(00746987,050

3735,0)(ˆ)

ˆ(ˆ árvorekg

n

RVRV i ��

c) intervalo de confiança para N

RR

N

Ii∑

== 1

árvorekgRVRs /0864,0)ˆ

(ˆ)ˆ

( ��

0864,001,294,2)ˆ

(ˆ

�� RstRIC

árvorekgRárvorekg /1137,3/7663,2 ��

Pode-se afirmar, com uma probabilidade de acerto de 95%, que a razão populacional (R) encontra-se no intervalo de 2,7663 kg/árvore a 3,1137 kg/árvore.

d) valor médio para a produção de semente por hahakgRXy

RAPP/907,1194,205,4 ��

Sendo:

árvoresN

x

X

N

i

i

05,4100

4051 ��

��

e) variância do valor médio para a produção de semente por ha

222)/(12252454,000746987,005,4)(ˆ)(ˆ hakgRVXyV

RAPP��

154


f) intervalo de confiança para o valor médio para a produ-ção de sementes

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional de produção de sementes en-contra-se no intervalo de 11,2035 kg / ha a 12,6111 kg / ha.

g) estimativa para o total da produção total de sementes

h) variância para o valor total da produção total de sementes

i) intervalo de confiança para o valor total da produção total de sementes

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional de produção de sementes encon-tra-se no intervalo de 1.120,35 kg a 1.261,05 kg.

hakgyVys RAPPRAPP /3500,01225,0)(ˆ)( ��

3500,001,2907,11)( ��RAPPRAPP

ystyIC

hakgYhakg /6105,12/2035,11 ��

kgRXNyNY RAPPRAPP 7,190.194,205,4100ˆ��

00746987,005,4100)()(ˆ)ˆ(ˆ 22222��

RAPPRAPPyVNRVXNYV

22339,225.1)ˆ(ˆ kgYV RAPP �

kgYVYs RAPPRAPP 00,352339,225.1)ˆ(ˆ)ˆ( ��

3501,27,190.1)ˆ(ˆ �� RAPPRAPP YstYIC

kgYkg 05,261.135,120.1 ��

155


j) discussão e conclusão

Verifica-se, através da Tabela 7.3, que as 50 árvores sor-teadas estão inseridas em 38 unidades (Unid), o que significa redução nos deslocamentos e diminuição nos custos do levan-tamento.

A amostra estudada de 38 Unid (50 árvores) foi retirada de uma população simulada com vetor de médias vY e matriz de covariâncias .∑

Resultando a matriz de correlações correspondente (Corr)

=

17094,0

7094,01orrC

Considerando a amostra de 50 árvores, sejam os resulta-dos amostrais para o vetor de médias, matrizes de covariâncias e de correlações:

Verifica-se que o valor médio verdadeiro 081,12=Y 12,081 está contido no intervalo de confiança (11,2035 kg/ha )./6105,12/2035,11( hakgYhakg ≤≤ 12,6105 kg/ha).

156


7.3 ESTIMATIVAS POR RAzãO: AMOSTRAGEM INVERSA COM PROBABILIDADE PROPORCIONAL À VARIáVEL AUxI-LIAR x (AIPP).

O processo da estimativa por razão com amostragem in-versa com probabilidade proporcional à variável auxiliar x é uma variação metodológica da estimativa por razão com probabilida-de proporcional à variável auxiliar (AAP).

No processo da estimativa por razão com probabilidade proporcional à variável auxiliar (AAP) quando o tamanho da amostra n é relativamente grande em relação ao tamanho da população N, na seleção da amostra, pode não ocorrer n unida-des distintas. No exercício 7.2, tal que N = 100, verificou-se 38 unidades distintas para 50 árvores. Obviamente, a repetição de unidades na amostra diminuirá o custo do levantamento.

Entretanto, para o caso de n ser relativamente grande em relação a N, pode-se, dentro dessa concepção estrutural, sortear tantas unidades necessárias, até atingir n+1 unidades distintas. A amostra será constituída pelas n unidades distintas, despre-zando-se a última unidade sorteada. Este processo é denomi-nado de Amostragem Inversa com Probabilidade Proporcional à variável auxiliar x (AIPP).

No exemplo aplicativo anterior, supondo que o desejo do planejador é ter n = 40, então seria necessário continuar o sor-teio até conseguir mais três unidades distintas das 38 já sortea-das. A última seria descartada.

Estabelecidas as n unidades distintas, a análise estatística da AIPP será análoga à APP, já abordada anteriormente.

157


7.4 ESTIMATIVAS POR RAzãO CONSIDERANDO A AMOS-TRAGEM ESTRATIFICADA

Na amostragem estratificada, considerando que os estra-tos são independentes, existem dois procedimentos distintos para estimar a média e o valor total através da estimativa por razão.

1) Efetuar as estimativas dentro de cada estrato.2) Efetuar a estimativa considerando todos os estratos glo-

balmente.

1) efetuar as estimativas dentro de cada estrato

Seja L o número de estratos, então:

h

hh x

yR =ˆ , onde Lh ,,1 L= .

Sejam as estimativas do valor médio e do total:

Sendo:

Consequentemente:

hhRh RXy ˆ� e hhhhhRhhRh RXRXNyNY ˆˆˆ ��

hhhXNX �

��

�

L

h

Rhhst yWy1

Re

� ��

��L

h

L

h

hhhh

L

h

h

h

stst YRXRXN

NNyNY

1 11

ReReˆˆˆˆ

158


Considerando que a amostra dentro de cada estrato seja relativamente grande, tem-se:

Tal que:

Assim como:

Daí, como os estratos são independentes:

2) efetuar a estimativa considerando todos os estratos globalmente

Dado que:

;1∑

=

=L

hhhest yWy ∑

=

=L

hhhest xWx

1

Determina-se a “razão combinada ou índice combinado” que é o quociente entre a média estratificada da variável res-posta de interesse y e média estratificada da variável resposta auxiliar x (covariável):

est

estC x

yR =ˆ

Resultando:

1

ˆˆ2

)()ˆ(ˆ 1 1

22

1

2

2 �

��

�

� ��

h

n

i

n

i

hihhihih

n

i

hi

hhh

hh

hn

xRyxRy

XNn

nNRV

h hh

)ˆ(ˆ)(ˆ 2

hhRh RVXyV � e )(ˆ)(ˆ

1

2

Re Rh

L

hhst yVWyV �

�

�

)(ˆ)ˆ(ˆ 2

RhhRh yVNYV �

.)ˆ(ˆ)ˆ(ˆ

1

��

�L

h

RhRYVYV

RCRC RXy ˆ�

159


Para grandes amostras, tem-se:

1

ˆˆ2

)()ˆ(ˆ 1 1

22

1

2

12 �

��

�

� ��

� ��

� h

n

i

n

i

hiRChihiRC

n

i

hiL

h hhh

hh

RCn

xRyxRy

XNn

nNRV

h hh

Sendo: )ˆ(ˆ)(ˆ 2

RCRCRVXyV �

;ˆˆˆCCRC RXRXNY �� XNX �

)ˆ(ˆ)ˆ(ˆ 2

RCRC RVXYV �

exercício 7.3

Seja uma área florestal de 10.000 ha, onde, através de téc-nicas de interpretação de imagens fotográficas, foram detecta-dos três estratos, a saber:

Estrato I (floresta alta sem babaçu) = 2.000 ha;Estrato II (floresta alta com babaçu) = 5.000 ha;Estrato III (floresta baixa cipoálica) = 3.000 ha.

Através da amostra simples ao acaso, foram selecionadas nos estratos as seguintes quantidades de unidades de amostra:

1n = 13; 2n = 15 e 3n = 11.

A estrutura da unidade amostral apresentou uma forma retangular de 10 m de largura e 250 m de comprimento, onde foram mensuradas todas as árvores com DAP 45 cm. A Tabela 7.4 apresenta os dados (simulados) por estrato para os volumes e número de árvores por parcela de 0,25 ha.

Analisar os dados considerando: 1) as estimativas dentro de cada estrato;

160


2) as estimativas considerando todos os estratos global-mente;

3) estimativas desconsiderando a variável auxiliar x (nú-mero de árvores);

4) discutir e concluir sobre os resultados.

tabela 7.4 - Amostra estratificada por razão: m3 / 0,25 ha.

EST I EST II EST III

y x y x y x

21,10 8 12,90 5 8,10 3

34,00 15 17,00 6 12,00 3

18,00 8 9,50 4 9,50 4

20,00 8 20,00 5 14,50 5

55,00 22 30,10 11 18,17 6

23,42 9 23,42 6 21,10 7

40,50 15 21,10 8 10,80 3

17,44 8 17,44 6 7,50 3

22,12 10 22,12 8 6,50 2

25,00 10 12,00 4 12,50 4

31,20 13 16,50 6 5,20 2

17,05 6 17,05 6

24,10 9 24,10 9

16,71 6

21,80 7

1) efetuar as estimativas dentro de cada estrato

a) informações gerais sobre os dados

2,0000.10

000.21

��ha

haW ; 5,0

000.10

000.52

��ha

haW ; ;3,0

000.10

000.33

��ha

haW

161


000.825,0

000.21

��ha

haN ; 000.20

25,0

000.52 ��

haN ; ;000.12

25,0

000.33 ��

ha

haN

hamn

y

y

n

i

i

25,0/8408,2613

93,348 3

1

1

1

1

1

��

��

hamn

y

y

n

i

i

25,0/7827,1815

74,281 3

2

1

2

2

2

��

��

hamn

y

y

n

i

i

25,0/4427,1111

87,125 3

3

1

3

3

3

��

��

haárvoresn

x

x

n

i

i

25,0/8462,1013

141

1

1

1

1

1

��

��

haárvoresn

x

x

n

i

i

25,0/4667,615

97

2

1

2

2

2

��

��

haárvoresn

x

x

n

i

i

25,0/8182,311

42

3

1

3

3

3

��

��

b) estimativa da razão R por estrato

4747,28462,10

8408,26ˆ

1

1

1��

x

yR

9045,24667,6

7827,18ˆ

2

2

2��

x

yR

9969,28182,3

4427,11ˆ

3

3

3��

x

yR

162


c) estimativas para os valores médios por razão por estrato

Devido ao desconhecimento dos valores populacionais, considerou-se: ;11 Xx = ;22 Xx = 33 Xx = .

d) estimativas para os valores totais por razão por estrato

e) média estratificada por razão

f) variância dos hR

Considerando: ;11 xX = ;22 xX = 33 xX = , têm-se:

hamRXyR 25,0/8411,264747,28462,10ˆ 3

111��

hamRXyR 25,0/7825,189045,24667,6ˆ 3

222��

hamRXyR 25,0/4428,119969,28182,3ˆ 3

333��

3

11173,728.214841091,26000.8ˆ myNY

RR��

3

22260,650.375782530,18000.20ˆ myNY

RR��

3

33316,313.137442764,11000.12ˆ myNY

RR��

��

�L

h

Rhh yWy1

Rest

hamy 25,0/1923,18442764,113,0782530,185,0841091,262,0 3Rest ��

3

RestRest48,692.727192312,18000.40ˆ myNY ��

1

ˆˆ2

)()ˆ(ˆ

1

1 1

2

1

2

1111

1

2

1

2

111

11

1

1 11

�

��

�

� ��

n

xRyxRy

XNn

nNRV

n

i

n

i

iii

n

i

i

163


g) variância da média por estrato

h) variância da média estratificada

i) limite de erro (LEDest) considerando as estimativas dentro de cada estrato

12

17574747,26,43464747,2236,802.10)

8462,10000.813

13000.8()ˆ(ˆ

2

21

��

��

��RV

710026881108,0)ˆ(ˆ1 �RV

1

ˆˆ2

)()ˆ(ˆ

2

1 1

2

2

2

2222

1

2

2

2

222

22

2

2 22

�

��

�

� ��

n

xRyxRy

XNn

nNRV

n

i

n

i

iii

n

i

i

14

6779045,26,945.19045,2205,681.5)

4667,6000.2015

15000.20()ˆ(ˆ

2

22

��

��

��RV

01027637,0)ˆ(ˆ2

�RV

1

ˆˆ2

)()ˆ(ˆ

3

1 1

23

23333

1

23

2

333

333

3 33

�

��

�

� ��

n

xRyxRy

XNn

nNRV

n

i

n

i

iii

n

i

i

10

1869969,28,5559969,2290,683.1)

8182,3000.1211

11000.12()ˆ(ˆ

2

23

��

��

��RV

014384036,0)ˆ(ˆ3

�RV

232

1

2

11)25,0/(316229509,0710026881108,08462,10)ˆ(ˆ)(ˆ hamRVXyV R ��

232

2

2

22)25,0/(429739402,001027637,04667,6)ˆ(ˆ)(ˆ hamRVXyV R ��

232

3

2

33)25,0/(209699848,0014384036,08182,3)ˆ(ˆ)(ˆ hamRVXyV R ��

)(ˆ)(ˆ

1

2

Rest Rh

L

h

h yVWyV ��

�

209699844,03,0429739402,05,0316229509,02,0)(ˆ 222

Rest��yV

23

Rest )25,0/(138957016,0)(ˆ hamyV �

164


j) variância do total por estrato

k) estimativa da variância do total da população

2) efetuar a estimativa considerando todos os estratos globalmente

a) informações gerais sobre os dados

%16,4192312,18

13895701,00296,2)(

Re

R e�

�

�

�

�

st

st

Des ty

ystLE

32

1

2

1158,688.238.20316229509,0000.8)(ˆ)ˆ(ˆ myVNYV

RR��

32

2

2

22 8,760.895.171429739402,0000.20)(ˆ)ˆ(ˆ myVNYV RR ��

32

3

2

33 11,778.196.30209699848,0000.12)(ˆ)ˆ(ˆ myVNYV RR ��

11,778.196.308,760.895.17158,688.238.20)ˆ(ˆ)ˆ(ˆ

1

��

L

h

RhR YVYV

3

1

5,227.331.222)ˆ(ˆ)ˆ(ˆ mYVYV

L

h

RhR��

�

165


b) estimativa da razão CR

Considerando:

Tem-se:

c) estimativa do valor médio

d) cálculo da estimativa da variância

Dado que:

Então:

haárvoresxXest

25,0/54805,6��

778281,254805,6

19232,18ˆ ��est

es t

Cx

yR

RCy

hamRXy RCRC 25,0/192323,18778281,254805,6ˆ 3��

1

ˆˆ2

)()ˆ(ˆ 1 1

22

1

2

12 �

��

�

� ��

� ��

� h

n

i

n

i

hiRChihiRC

n

i

hiL

h hh

hh

RCn

xRyxRy

XNn

nNRV

h hh

1

ˆˆ2

)()ˆ(ˆ 1 1

22

1

2

12 �

��

�

� ��

� ��

� h

n

i

n

i

hiRChihiRC

n

i

hiL

h hh

hh

RCn

xRyxRy

XNn

nNRV

h hh

321)ˆ(ˆ VVVRV RC ��

1

ˆˆ2

)(1

1 1

2

1

2

11

1

2

1

2

11

111

1 11

�

��

�

� ��

n

xRyxRy

XNn

nNV

n

i

n

i

iRCiiRC

n

i

i

12

757.1778281,26,346.4778281,2236,802.10)

54805,6000.813

)13000.8((

2

21

��

��

��V

031675905,01

�V

1

ˆˆ2

)(2

1 1

2

2

2

22

1

2

2

2

222

22

2

2 22

�

��

�

� ��

n

xRyxRy

XNn

nNV

n

i

n

i

iRCiiRC

n

i

i

14

677778281,26,945.1778281,2205,681.5

54805,6000.2015

15000.202

22

��

��

��V

010638342,02 �V

1

ˆˆ2

)(3

1 1

2

3

2

33

1

2

3

2

333

333

3 33

�

��

�

� ��

n

xRyxRy

XNn

nNV

n

i

n

i

iRCiiRC

n

i

i

10

186778281,28,555778281,2290,683.1

54805,6000.1211

11000.122

23

��

��

��V

790066234782,03 �V

166


Finalmente:

e) cálculo da estimativa da variância

f) cálculo da estimativa do valor total

g) cálculo da variância do valor total

h) limite de erro (LERC) considerando todos os estratos glo-balmente

1

ˆˆ2

)(1

1 1

2

1

2

11

1

2

1

2

11

111

1 11

�

��

�

� ��

n

xRyxRy

XNn

nNV

n

i

n

i

iRCiiRC

n

i

i

12

757.1778281,26,346.4778281,2236,802.10)

54805,6000.813

)13000.8((

2

21

��

��

��V

031675905,01

�V

1

ˆˆ2

)(2

1 1

2

2

2

22

1

2

2

2

222

22

2

2 22

�

��

�

� ��

n

xRyxRy

XNn

nNV

n

i

n

i

iRCiiRC

n

i

i

14

677778281,26,945.1778281,2205,681.5

54805,6000.2015

15000.202

22

��

��

��V

010638342,02 �V

1

ˆˆ2

)(3

1 1

2

3

2

33

1

2

3

2

333

333

3 33

�

��

�

� ��

n

xRyxRy

XNn

nNV

n

i

n

i

iRCiiRC

n

i

i

10

186778281,28,555778281,2290,683.1

54805,6000.1211

11000.122

23

��

��

��V

790066234782,03 �V

321)ˆ(ˆ VVVRV RC ��

048937725,0790066234782,0010638342,0031675905,0)ˆ(ˆ��RCRV

2322)25,0/(098300819,2048937725,054805,6)ˆ(ˆ)(ˆ hamRVXyV

RCRC��

2322)25,0/(098300819,2048937725,054805,6)ˆ(ˆ)(ˆ hamRVXyV

RCRC��

39161,692.727778281,254805,6000.40ˆˆ mRXNY

CRC��

árvoresxNXest

0,922.26154805,6000.40 ��

39161,692.727778281,254805,6000.40ˆˆ mRXNY

CRC��

árvoresxNXest

0,922.26154805,6000.40 ��

0,310.281.357.3048937725,0922.261)ˆ(ˆ)ˆ(ˆ 22�� RCRC RVXYV

0,310.281.357.3048937725,0922.261)ˆ(ˆ)ˆ(ˆ 22�� RCRC RVXYV

%16,16192312,18

09830081,20296,2)(

Re

Re�

�

�

�

�

st

st

RCy

ystLE

167


3) estimativas desconsiderando a variável auxiliar x (número de árvores). Análise convencional (metodologia da AsA)

Objetivando promover comparações em termos de preci-são, obter as estimativas desconsiderando a variável auxiliar x (número de árvores).

a) média estratificada da variável de interesse

b) variância da média estratificada da variável de interesse

Pois:

c) limite de erro (LESV) desconsiderando a variável auxiliar x (número de árvores)

4427,11000.40

000.127827,18

000.40

000.208408,26

000.40

000.8

1

��

L

h

hhes tyWy

hamyest 25,0/19232,18 3�

1555915,4540000

10310813,1

)(ˆ)(ˆ)(ˆ

11

2

��

L

h

hh

L

h h

hhest

N

yVW

n

yVWyV

23 )25,0/(0299524,1)(ˆ hamyV est �

0310813,1)(ˆ

1

2

��

�L

h h

hh

n

yVW

1555915,45)(ˆ

1

��

L

h

hhyVW

%32,1119232,18

0299524,10296,2)(�

�

�

�

�

est

estSV

y

ystLE

168


4) discutir e concluir sobre os resultados

Na Tabela 7.5 estão os resultados a partir das análises re-alizadas.

tabela 7.5 - Resultados das análises da amostra estratificada.

Método Média (m3/0,25 ha)

Variância da média(m3/0,25 ha) LE %

Convencional (ASA) 18,192320 1,029952400 11,32

Razão (estratos) 18,192312 0,138957016 4,16

Razão (combinada) 18,192323 2,098300810 16,16

Usando a definição de eficiência como o quociente entre o limite de erro sem considerar a variável auxiliar número de árvo-res e o limite de erro estimado pelo método da razão dentro de cada estrato, tem-se:

A partir da definição de eficiência como o quociente entre o limite de erro estimado pelo método da razão, considerando todos os estratos globalmente, e o limite de erro sem usar a va-riável auxiliar número de árvores, resulta:

Dada a definição de eficiência como o quociente entre o limite de erro pelo método da razão analisando os estratos de forma global e o limite de erro estimado pelo método da razão considerando os estratos separadamente, tem-se:

7212,2%16,4

%32,11 ��Dest

SV

LE

LEEf

4276,1%32,11

%16,16 ��SV

RC

LE

LEEf

169


Os resultados mostram um limite de erro de 11,32% não usando na análise a variável auxiliar número de árvores por par-cela. Este limite de erro corresponde a um valor 172,12% maior que o estimado pelo método por razão com as estimativas den-tro de cada estrato (4,16%). Conclui-se que esta estimativa (ra-zão) é mais eficiente.

Dado que:

Os resultados mostram um limite de erro de 16,16% pelo método por razão a partir das estimativas para todos os estratos globalmente. Este limite de erro corresponde a um valor 42,76 % maior que o limite de erro estimado pelo método quando não considerado na análise a variável auxiliar número de árvores (4,16 %), demonstrando que este método apresenta uma efici-ência superior àquele.

Dado que:

Os resultados apresentam um limite de erro de 16,16% pelo método por razão considerando as estimativas para todos os estratos globalmente. Este limite de erro corresponde a um valor 288,46% maior que o limite de erro estimado pelo método por razão quando as estimativas forem obtidas dentro de cada estrato (4,16%), demonstrando que o método de análise por ra-zão a partir das estimativas dentro de cada estrato apresenta

8846,316,4

16,16 ��Dest

S V

LE

LEEf

SVDe stLELE � , ou seja,

7212,2

SV

Dest

LELE �

RCSVLELE � , ou seja,

4276,1

RC

SV

LELE �

170


uma eficiência superior ao método por razão usando as estima-tivas para todos os estratos globalmente.

Dado que:

7.5 DUPLA AMOSTRAGEM: FASES DEPENDENTES

Para a aplicação do método de estimativa por razão é im-prescindível o conhecimento prévio do valor médio populacional da variável auxiliar x. Queiroz (1993a) cita que, geralmente, em inventários de florestas naturais é impossível conhecer o valor médio populacional ( X ) da variável auxiliar x. O referido autor recomenda proceder à dupla amostragem para tomar xX = , acrescentando que se X é desconhecido pode-se, desde que não implique em grande aumento de custo, medir uma amostra maior para a variável x, principalmente se x for uma variável de fácil medição, como exemplo a contagem de árvores.

Seja 1n uma amostra maior de N onde será medida a vari-ável auxiliar (x). Estima-se, através da amostra de tamanho ,1na média X . Seja 2n uma subamostra de ,1n onde será medida a variável de interesse (y). Observar que em 2n são medidas as variáveis x e y. A estrutura metodológica da estimativa por razão é aplicada dentro da subamostra de tamanho ,2n caracterizando duas fases dependentes.

Admitindo que a amostragem nas duas fases seja simples ao acaso, então:

2

2ˆx

yR =

Considerando 11 Xx = , tem-se:

RCDe stLELE � , ou seja,

8846,3RC

dest

LELE �

171


RXyRˆ

11 = e 11ˆ

RR yNY =

É evidente que a média 1Ry1R é uma estimativa da média 1Ydas 1n unidades de amostra da primeira fase. No entanto, 1Y é uma estimativa de ,Y logo se pode afirmar que 1Ry1R é uma “esti-mativa de uma estimativa de média”.

Daí, a sua variância:

1

1

2

1 1

22

1

2

21

211

)(ˆ)(

1

ˆˆ2)()(ˆ

2 22

n

yV

N

nN

n

xRyxRy

nn

nnyV

n

i

n

iiii

n

ii

R

−+

−

+−−

=∑ ∑∑

= == (7.1)

A primeira parte corresponde à variância de 1Ry1R e a segun-da parte é a variância de 1y .

A Expressão 7.1 pode ser apresentada nas formas 7.2 e 7.3.

1

12

21

21 )(ˆ)()](ˆˆ),(ˆˆ2)(ˆ)[()(ˆ

n

yV

N

nNxVRyxVRyV

nn

nnyV 1R

��

�� (7.2)

N

yV

n

xVRyxVR

n

yxVRxVRyVyV R

)(ˆ)(ˆˆ),(ˆˆ2),(ˆˆ2)(ˆ)(ˆ)(ˆ

1

2

2

2

1 −−

+−+

= (7.3)

Sendo:

;1

)(

)(ˆ

2

2

2

1

1

2

2

2

�

�

�

��

�

n

n

y

y

yV

n

i

in

i

i

;1

)(

)(ˆ

2

2

2

1

1

2

2

2

�

�

�

��

�

n

n

x

x

xV

n

i

in

i

i

.1

))(

),(ˆ

2

2

11

1

22

2

�

�

�

��

��

�

n

n

yx

yx

yxV

n

i

i

n

i

in

i

ii

172


Se )(ˆ1RyV , tem-se: ).(ˆ)ˆ(ˆ

12

1 RR yVNYV = ).

Vries (1986) sugere usar )(1 xV que é um estimador mais preciso do que )(ˆ xV , sendo:

1

)(

)(ˆ1

1

2

1

1

2

1

1

1

−

−=

∑∑ =

=

n

n

xx

xV

n

iin

ii

exercício 7.4

Considerar as observações contidas na Tabela 7.6 como uma subamostra n2 = 30 de uma amostra maior de n1 = 50 uni-dades e que nas n1 - n2 = 20 unidades foi apenas quantificado o número de árvores.

tabela 7.6 - Estimativa por razão com igual probabilidade (AIP) com dupla amostragem.

UA xi yi UA xi yi UA xi yi UA xi UA xi

1 6 13,0 11 5 16,5 21 10 30,5 31 8 41 82 4 16,1 12 4 17,1 22 7 14,7 32 5 42 53 4 9,7 13 6 17,6 23 8 19,0 33 8 43 54 5 20,1 14 9 24,0 24 6 19,7 34 4 44 55 9 29,6 15 5 16,7 25 6 18,4 35 2 45 76 8 23,4 16 5 21,9 26 8 25,4 36 6 46 87 5 21,9 17 3 10,4 27 8 18,6 37 5 47 68 4 17,5 18 5 10,0 28 6 18,9 38 5 48 59 8 22,1 19 4 14,5 29 9 28,3 39 5 49 610 5 12,8 20 7 29,7 30 7 22,0 40 7 50 5

173


a) informações amostrais preliminares sobre as variáveis y e x

iy = volume em m3/0,25 haix = número de árvores/0,25 ha

;501 �n ;302 �n 216.14�N

3

1 1

2

10,580 myyn

i i

ii� ��

��

� ��

�2 2

1 1

186

n

i

n

i

ix árvores

haárvores

x

x i

i

25,0/2,630

186

30

1

2��

��

ham

y

yi

i

25,0/3367,1930

10,580

30

31

2 ��

��

02,650

301

50

50

1

1

11

1

��

�� i

i

n

i

i x

n

x

x

6748,3229

30

10,58077,164.12

1

)(

)(ˆ

2

2

2

2

1

1

2

2

2

�

�

��

�

�

��

�

n

n

y

y

yV

n

i

in

ii

4759,329

30

1860,254.1

1

)(

)(ˆ

2

2

2

2

1

1

2

2

2

�

�

��

�

�

��

�

n

n

x

x

xV

n

i

in

i

i

0752,829

30

10,5801868,830.3

1

))((

),(ˆ

2

2

11

1

22

2

�

��

��

�

�

��

�

n

n

yx

yx

yxV

n

i

i

n

i

in

i

ii

2n

2n

2n

174


b) estimativa da razão

c) estimativa por razão do valor médio

Considerando 02,61 == Xx 6,02 , tem-se:

d) estimativa por razão do valor total

e) variância do valor médio por razão

Usando as Expressões 7.2 e 7.3, têm-se os mesmos resul-tados:

árvoremx

yR /1188,3

2,6

3367,19ˆ 3

2

2 ��

hamRXy1R 25,0/7752,181188,302,6ˆ 3

1��

326,410.2687752,18296.14ˆ myNY 1R1R ��

1

1

2

1 1

22

1

2

21

21 )(ˆ)(

1

ˆˆ2

)()(ˆ

2 22

n

yV

N

nN

n

xRyxRy

nn

nnyV

n

i

n

i

iii

n

i

i

1R

��

�

��

�

� ��

50

6748,32)

296.14

50296.14(

29

254.11188,38,830.31188,3277,164.12)

3050

3050()(ˆ

2�

��

�

��yV

86607081,0651210409,011453013,16013333333,0)(ˆ ��yV

1R

1R

1

12

21

21)(ˆ

)()](ˆˆ),(ˆˆ2)(ˆ)[()(ˆ

n

yV

N

nNxVRyxVRyV

nn

nnyV

1R

�

��

�

�

50

6748,32)

296.14

50296.14(]4759,31188,30752,81188,326748,32)[

3050

3050()(ˆ 2 �

��

�

��yV

86607322,0651210409,0214862812,0)(ˆ��yV

N

yV

n

xVRyxVR

n

yxVRxVRyVyV

)(ˆ)(ˆˆ),(ˆˆ2),(ˆˆ2)(ˆ)(ˆ)(ˆ

1

2

2

2

��

��

�

0,296.14

6748,32

50

475 9,31188.30752,81188,32

30

0752,81188,324759,31188,36748,32)(ˆ

22

��

��

�yV

866077322,0750022855903,0331201781,053715703,0)(ˆ��yV

1R

1R

1R

1R

1R

175


Cálculo de )(ˆ1RyV segundo Vries (1986).

Então:

Os cálculos referentes aos intervalos de confiança, limite de erro e outros, seguem conforme já visto.

7.6 COMPARAçãO DE DOIS íNDICES OU DUAS RAzõES

Pode ser de interesse em um inventário comparar duas ra-zões ou índices ( 1R e 2R ) entre dois tipos florestais. De acordo com o procedimento amostral, existem as seguintes situações:

1) Os índices são independentes.2) Os índices são calculados para a mesma variável auxi-

liar (x).3) Os dois índices são correlacionados.

1) os índices são independentes

Sejam 1

11

ˆx

yR = e

2

22

ˆx

yR = .

N

yV

n

xVRyxVR

n

yxVRxVRyVyV

1R

)(ˆ)(ˆˆ),(ˆˆ2),(ˆˆ2)(ˆ)(ˆ)(ˆ

1

1

2

2

1

2

��

��

�

0404,349

50

3011961

1

)(

)(ˆ

2

1

1

2

1

1

2

1

1

1

�

�

��

�

�

��

�

n

n

x

x

xV

n

i

in

i

i

0,296.14

6748,32

5 0

040 4,31188.30752,81188,32

30

0 752,811 88,320 404,31188,36748,3 2)(ˆ

22

1�

��

��

RyV

809592276,0750022855903,0415923197,039595467,0)(ˆ1 ��RyV

176


Neste caso, a variância estimada do contraste entre R1 e R2 é dada por:

)ˆ(ˆ)ˆ(ˆ)ˆˆ(ˆ2121 RVRVRRV +=−

A partir dessas informações é possível estruturar as análi-ses estatísticas de interesse, como por exemplo: testar a hipóte-se 210 : RRH = através da estatística “t” de Student e calcular o intervalo de confiança.

2) os índices são calculados para a mesma variável au-xiliar ( x )

Sejam x

yR 1

1ˆ = e .ˆ 2

2 x

yR =

Então: x

d

x

yy

x

y

x

yRR =

−=−=− 2121

21ˆˆ

Sendo:

n

dd

n

ii∑

== 1 para iii yyd 21 −=

Neste caso, a variância estimada do contraste entre R1 e R2 é dada por:

2

121221 ])ˆˆ([

)1(

1)ˆˆ(ˆ

i

n

ii xRRd

xnnRRV ∑

=

−−−

=−

Dado que:

∑∑==

−+−−=−−n

iiiiii

n

ii xRRxdRRdxRRd

1

222121

22

121 ])ˆˆ()ˆˆ(2[])ˆˆ([

177


Então:

1

)ˆˆ()ˆˆ(21

)ˆˆ(ˆ 1 1

2221

121

2

221 −

−+−−=−

∑ ∑∑= ==

n

xRRydRRd

xnRRV

n

i

n

ii

n

iiii

3) os índices são correlacionados

Sejam 1

11

ˆx

yR = e .ˆ

2

22 x

yR =

Neste caso, a variância estimada do contraste entre R1 e R2 é:

)ˆ,ˆ(ˆ2)ˆ(ˆ)ˆ(ˆ)ˆˆ(ˆ212121 RRVOCRVRVRRV −+=−

Tal que:

1

ˆˆˆ

)1

()ˆ,ˆ(ˆ 1 1 12121122

121121

2121 −

+−−=

∑ ∑ ∑∑= = ==

n

xxRRyxRyxRyy

xxnRRVOC

n

i

n

i

n

iiiii

n

iiiii

exercício 7.5

Seja uma amostra de 20 famílias de uma população de produtores rurais. Os dados coletados estão apresentados na Tabela 7.7, onde x é o número de componentes por família; 1y é a renda líquida obtida por hectare (número de salários mínimo);

2y é a despesa por hectare (número de salários mínimo) do manejo dos recursos florestais. Confrontar os dois índices ou as duas razões pelo teste “t”.

Neste caso os índices serão calculados a partir da mesma variável auxiliar (x).

178


tabela 7.7 - Dados por família: comparação de dois índices ou duas razões.

Família xi 1y 2y iii yyd 21 −= ii xd

1 6 3,92 5,22 -1,30 -7,802 4 4,96 2,33 2,63 10,523 5 4,06 4,47 -0,41 -2,054 4 2,30 2,83 -0,53 -2,125 7 4,68 4,27 0,41 2,876 5 4,22 3,43 0,79 3,957 4 3,70 2,82 0,88 3,528 6 3,62 4,66 -1,04 -6,249 6 2,65 5,62 -2,97 -17,82

10 4 3,31 3,15 0,16 0,6411 5 6,38 3,88 2,50 12,5012 4 6,90 2,89 4,01 16,0413 5 6,10 4,06 2,04 10,2014 5 3,50 3,70 -0,20 -1,0015 4 1,61 3,82 -2,21 -8,8416 5 3,74 3,97 -0,23 -1,1517 6 3,89 5,08 -1,19 -7,1418 4 3,93 2,95 0,98 3,9219 6 3,77 4,45 -0,68 -4,0820 4 4,52 2,32 2,20 8,80

a) cálculo dos índices ou razões

825859,0950,4

088,4ˆ 11 ===

x

yR , 766869,0

950,4

796,3ˆ 22 ===

x

yR

b) estimativa da variância do contraste entre 1R e 2RA variância estimada do contraste entre 1R e 2R é:

1

)ˆˆ()ˆˆ(2)

1()ˆˆ(ˆ 1 1

2221

121

2

221 −

−+−−=−

∑ ∑∑= ==

n

xRRxdRRd

xnRRV

n

i

n

ii

n

iiii

179


19

507)766869,0825859,0(72,14)766869,0825859,0(2698,59)

95,420

1()ˆˆ(ˆ

2

221

��

�

�� RRV

0064145552,0)ˆˆ(ˆ21

�� RRV

Logo:

0800909,0)ˆˆ(ˆ)ˆˆ( 2121 =−=− RRVRRs

c) testar 210 : RRH =

ns

RRs

RRt 7365,0

0800909,0

766869,0825859,0

)ˆˆ(

ˆˆ

21

21�

�

�

�

�

�

Não há razão para rejeitar H0 : R1 = R2, visto que t19 ; 0,025 = 2,09. Conclui-se que os dois índices são estatisticamente iguais, tal que 1R é o índice referente à renda líquida por hectare e 2R é o índice referente às despesas por hectare.

19

507)766869,0825859,0(72,14)766869,0825859,0(2698,59)

95,420

1()ˆˆ(ˆ

2

221

��

�

�� RRV

0064145552,0)ˆˆ(ˆ21

�� RRV

cApítulo 8

estImAtIvAs por regressão

Define a estimativa por regressão, descrevendo os parâ-metros populacionais e os seus estimadores. Mostra teorica-mente quando usar as estimativas por razão e por regressão. Apresenta a metodologia para obter estimativas por regressão considerando a amostragem estratificada ao acaso. Mostra exercícios aplicativos considerando várias alternativas de aná-lise, principalmente comparando as estimativas por razão e por regressão.

183

Estimativa por regressão

Em levantamentos por amostragem, como descrito no capí-tulo referente ao estudo das estimativas por razão, pode ocorrer caso em que há a necessidade de se obter estimativa da relação entre duas variáveis aleatórias x e y, normalmente correlaciona-das para cada unidade de amostra. O uso das estimativas por razão e por regressão objetiva obter maior precisão na análise dos dados, através da utilização de uma variável auxiliar xi que se correlaciona com a variável resposta de interesse yi.

A utilização da estimativa por razão é recomendada quando existir uma relação linear entre as variáveis x e y e que a reta de regressão passe pela origem do sistema de eixos coordenados.

Entretanto, pode acontecer que mesmo havendo tendência linear entre x e y a reta de regressão de y em x pode não passar pela origem do sistema de eixos coordenados. Neste caso, é recomendável e mais preciso o uso da estimativa por regressão.

8.1 PARâMETROS POPULACIONAIS E ESTIMADORES

Dado que:X = média populacional para a variável auxiliar x;Y = média populacional para a variável de interesse y;x = média amostral para a variável auxiliar x;y = média amostral para a variável de interesse y;

=RLy RL = média estimada por regressão para a variável de in-teresse y;

b = coeficiente de inclinação estimado da reta de regres-são;

B = coeficiente de inclinação populacional da reta de re-gressão;

=RLYRL = valor amostral por regressão para o valor populacio-nal da variável de interesse y;

184


N = número total de unidades da população;n = número de unidades de amostra do inventário florestal.

a) estimativa do valor médio por regressão RLy

Sejam xi e yi as observações realizadas em uma amostra de tamanho n, em que o valor médio verdadeiro X da variável x é conhecido.

Da teoria de regressão, a média estimada por regressão RLyRL para a variável de interesse y é obtida pela fórmula:

RLyRL )( xXbyyRL −+= (8.1)

Tal que: BbE =)(Pode ser verificado pela fórmula de estimação da média

por regressão 8.1 que RLyRL é um estimador consistente da média populacional, pois se Nn = , então, Xx = e ,Yy = logo:

RLyRL YxXbyyRL =−+= )(

Pode-se obter a estimativa do valor de total =RLYRL pela fórmu-la: =RLYRL RLRL yNY =ˆ

RL .

O coeficiente de inclinação ou angular b da reta de regres-são pode em alguns levantamentos ser fixado, mas, geralmente, no caso de inventários florestais deverá ser obtido através da amostra.

No caso do coeficiente angular ser fixado como zero (b = 0), verifica-se que o resultado da estimativa por regressão é o mes-mo da Amostra Simples ao Acaso (ASA).

Se 0=b , então: RLyRL yyRL = , pois RLyRL )( xXbyyRL −+= .

185


No caso do coeficiente angular ser xyb = , a estimativa por regressão coincide com a estimativa por razão.

Se xyb = , então, RLyRL .RRL yy =

b) variância da média do valor médio por regressão RLyRL

Sob o ponto de vista teórico, o método da estimativa por regressão, no caso de pequenas amostras, apresenta o inconve-niente de não estar devidamente solucionado o problema da defi-nição da fórmula para a obtenção da variância da média, mas no caso de grandes amostras, o que ocorre em inventários florestais, é possível obter a expressão para calcular uma boa estimativa.

A fórmula da variância da média nas estimativas por re-gressão pode ser obtida considerando as seguintes condições:

1) Variância da média com o coeficiente angular prefi-xado

No caso de inventários florestais não é usual prefixar o va-lor do coeficiente angular, mas admitindo que 0bb = :

)(0 xXbyyRL ��

Se 0b é fixado, pode-se comprovar tratar-se de um estima-dor não tendencioso, pois .)( YyE RL � . Visto que:

YxXbyEyE RL �� )]([)( 0

Seja o desvio considerando cada unidade da população:

)()( 00 XxbYyYxXbyYye iiiiRLii ��

186


Pela definição de variância da média:

Por conseguinte:

Resultando:

Sendo:

Seja o questionamento: Qual o valor ideal para b0? A res-posta seria o valor de b0 que torna mínimo o valor de V ( )( RLyV RL).

Seja 8.2 a Expressão para obter o valor do coeficiente an-gular populacional B, o qual também é denominado coeficiente de regressão linear de y sobre x.

)(

),(

)(

))((

2

1

1

2

1

11

xV

yxV

N

x

x

N

yx

yx

BN

i

iN

i

i

N

i

N

i

i

N

i

i

ii

�

�

�

�

��

��

�

�

�

��

(8.2)

n

yV

N

nNyV RL

RL

)()()(

�

�

)](),(2)()[()( 2

00 xVbyxVbyVnN

nNyV RL ��

��

)](ˆ),(ˆ2)(ˆ)[()(ˆ 2

00 xVbyxVbyVnN

nNyV RL ��

��

187


Como b0 é um valor prefixado, seja b0 = B + k, onde B é o valor verdadeiro e k o desvio de b0 em relação a B.

Daí:

Tomando-se a primeira e a segunda derivadas dessa ex-pressão em relação à variável k, verifica-se que V ( )( RLyV RL) torna-se mínima quando k = 0. Concluindo-se que o valor de b0 que torna mínima a variância da estimativa da média é b0 = B.

Logo:

Portanto:

Dado que ])()([),(22 yVxVyxV ×=d , onde 2d é o coefi-ciente de correlação ao quadrado, então:

Resultando:

1

)()()()()(2)(

)()( 1 1

22

1

2

�

��

�

� ��

N

XxkBXxYykBYy

nN

nNyV

N

i

N

i

ii

N

I

ii

RL

1

)()()(2)(

)()( 1 1

22

1

2

min�

��

�

� ��

N

XxBXxYyBYy

nN

nNyV

N

i

N

i

ii

N

I

ii

RL

)](),(2)()[()( 2

minxVByxVByV

nN

nNyV

RL��

��

)}(])(

),([),(

)(

),(2)(){()( 2

min xVxV

yxVyxV

xV

yxVyV

nN

nNyV RL ��

��

])(

),()()[()(

2

minxV

yxVyV

nN

nNyV RL �

��

])()()[()( 2

min yVyVnN

nNyV RL ��

��

)]1)(()[()( 2

min ��

� yVnN

nNyV RL

188


2) Variância da média com o coeficiente angular esti-mado através da amostra

Seja uma amostra de n pares de valores xi e yi. Da teoria de Regressão Linear Simples, pelo método dos quadrados mí-nimos, tem-se que a estimativa do coeficiente angular B da reta, denominado também de coeficiente de regressão, é dada pela fórmula:

n

x

x

n

yx

yx

bn

i

in

i

i

n

i

n

i

i

n

i

i

ii

2

1

1

2

1

11

)(

))((

��

��

�

�

�

��

�

�

�

Então:

Em termos populacionais, sendo E(b) = B, pode-se escrever:)( XxBYye iii −−−=

Seja:

2

11

2 )]([ XxBYye ii

N

i

N

i

i ��

Da definição de variância da média:

)( xXbyyRL ��

1)()( 1

2

�

��

��

N

e

Nn

nNyV

N

i

i

RL

189


Como:

�

�

�

�

�

��

�N

i

i

N

i

ii

Xx

YyXx

B

1

2

1

)(

))((

Então:

� ��

��N

i

N

i

iii XxBYyXx1 1

2)())((

Logo:

1

)()(2)(

)()( 1 1

22

1

222

�

��

�

� ��

N

XxBXxBYy

Nn

nNyV

N

i

N

i

i

N

i

ii

RL

1

)()(

)()(1 1

222

�

��

�

� ��

N

XxBYy

Nn

nNyV

N

i

N

i

ii

RL

Dado que:

� �

�

� �

�

��

��

�N

i

N

i

ii

N

i

ii

YyXx

YyXx

1 1

22

2

12

])(][)([

]))(([

�

1

)]()[(

)()( 1

2

�

��

�

��

N

XxBYy

Nn

nNyV

N

i

ii

RL

1

])())((2)[(

)()( 1

222

�

��

�

��

N

XxBYyXxBYy

Nn

nNyV

N

i

iiii

RL

190


Então:

∑

∑

=

=

−

−=

N

ii

N

ii

Yy

XxB

1

2

1

22

2

)(

)(d

Portanto:

∑

∑

=

=

−

−=

N

ii

N

ii

Xx

YyB

1

2

1

22

2

)(

)(d

Por conseguinte:

Finalmente, a fórmula da estimativa da variância da esti-mativa da média por regressão, tal que o coeficiente angular é estimado através da amostra, é:

A estimativa da variância da estimativa da média pela re-gressão também pode ser obtida usando-se a teoria da análise de regressão simples.

1

)()(

)()( 1 1

222

�

��

�

� ��

N

YyYy

Nn

nNyV

N

i

N

i

ii

RL

�

)1)(()()( 2��

� yVNn

nNyV RL

)ˆ1)((ˆ)()(ˆ 2��

�� yV

Nn

nNyV RL

sRL MQNn

nNyV Re

ˆ)()(ˆ �

� , tal que .2

ˆˆ Re

Re�

�

n

QSMQ s

s

191


O termo sQS Reˆ

Resé a soma estimada de quadrados do resíduo da regressão linear simples. O divisor n - 2 produz uma estima-tiva sem tendência de V (y) quando a população é infinita e a regressão é linear.

Dado RLyRL e V ( RLyRL), pode-se obter:

Pode-se comparar a precisão considerando a metodologia da amostra simples ao acaso em relação à estimativa por re-gressão.

Sejam as respectivas variâncias da média: Variância da média para a amostra simples ao acaso:

)()()( yVnN

nNyV

−=

Variância da média para a estimativa por regressão:

Da comparação dessas expressões, conclui-se que se 0=d implica que V ( RLyRL) = V ( RLy). Então, a amostra simples ao

acaso tem a mesma precisão da estimativa por regressão.Se 02 >d implica que V ( RLyRL) < V ( RLy), então a amostra sim-

ples ao acaso é menos precisa que a estimativa por regressão.

c) intervalo de confiança para a média Y e para o valor total Y

RLRL yNY �ˆ e )(ˆ)ˆ( 2

RLRL yVNYV �

)1)(()()( 2��

�� yV

nN

nNyV RL

192


exercício 8.1

Seja uma área florestal populacional de 100 ha com ocor-rências de 405 árvores matrizes (dados simulados). O objetivo é monitorar a produção de sementes de uma determinada espécie florestal. A área está subdividida em 100 subáreas de 1 ha. As 405 matrizes da espécie em estudo estão perfeitamente locali-zadas em um mapa logístico. A Tabela 8.1 apresenta os dados de produção de sementes e o número de árvores referentes a uma amostra de n = 38 unidades (38 ha), obter:

1) a estimativa por razão; 2) a estimativa sem considerar a variável auxiliar (número

de árvores);3) a estimativa por regressão;4) concluir sobre os resultados.

Dado:iy = Peso de sementes por haix = Número de árvores por ha

tabela 8.1 - Produção em kg de sementes (yi) e número de árvores (xi).

Unid xi yi Unid xi yi Unid xi yi

1 5 16,15 14 4 12,57 27 5 14,582 3 10,53 15 4 10,88 28 5 14,143 4 8,50 16 4 13,03 29 3 11,944 5 11,90 17 3 11,11 30 5 12,375 3 9,07 18 4 10,28 31 3 11,036 4 13,23 19 5 13,14 32 5 12,717 4 11,48 20 5 13,44 33 3 8,938 5 14,71 21 6 14,14 34 6 15,759 3 10,95 22 4 15,40 35 2 10,71

10 4 15,31 23 5 12,20 36 7 15,0111 4 11,26 24 4 12,58 37 6 13,7612 4 11,73 25 4 13,13 38 3 8,1913 7 16,42 26 6 14,39

Total 166 476,65

193


1) estimativa por razão

a) cálculo da estimativa da razão

Peso de sementes total e número total de árvores na amostra:

kgyn

i

i��

�1

65,476

��

�n

i

ix1

166 árvores

871386,2166

65,476ˆ

1

1 ��

�

�

�

�

n

i

i

n

i

i

x

y

R

b) estimativa da variância de R

)],(ˆˆ2)(ˆˆ)(ˆ[)ˆ(ˆ 2

2yxVRxVRyV

XnN

nNRV ��

��

Dado que:

haárvoresX /05,4100

405��

2)/(5477,4)(ˆ hakgyV �

2)/(3741,1)(ˆ haárvoresxV � e 8090,1),(ˆ �yxV , tem-se:

)8090,1871386,223741,1871386,25477,4(05,410038

38100)ˆ(ˆ 2

2��

��

��RV

005459271,0)ˆ(ˆ�RV

c) estimativa do desvio padrão de R

073887,012803270054592708,0)()ˆ( ===∧

RVRs

194


d) intervalo de confiança para R

Seja t = 2,0278 o valor da distribuição de Student com 37 graus de liberdade para o nível de significância a = 0,05, têm-se:

Limite inferior 721558,2073887,00278,2871386,2)ˆ(ˆ =×−=×− RstR

Limite superior021214,3073887,00278,2871386,2)ˆ(ˆ =×+=×+ RstR

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor verdadeiro ou paramétrico da razão encontra-se no intervalo de 2,721558 a 3,021214.

e) estimativa da média da produção de sementes Ry e sua variância )(ˆ

RyV

hakgXRyR

/6291,1105,4871386,2ˆ��

222)/(08954569,00054592708,005,4)ˆ(ˆ)(ˆ hakgRVXyV

R��

hakgyVhays RR /299242,0)(ˆ/)( ��

f) estimativa do total RY e sua variância )(ˆRyV

kgXNRYR

91133,162.105,4100871386,2ˆˆ��

22222456893,8950054592708,005,4100)ˆ(ˆ)ˆ(ˆ kgRVXNYV R ��

kgYVYsRR

92418575,29)ˆ(ˆ)ˆ( ��

g) intervalo de confiança para o valor médio Y

Limite inferiorhakgysty RR /02229707,11299242,00278,26291,11)( ��

195


Limite superior

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 11,022297 kg/ ha a 12,235903 kg/ ha.

h) intervalo de confiança para o valor total Y

Limite inferior kgYstY

RR231066,110292418575,290278,291133,1162)ˆ(ˆ

��

Limite superiorkgYstY RR 591594,122392418575,290278,291133,1162)ˆ(ˆ

��

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 1.102,231066 kg a 1223,591594 kg.

i) limite de erro da estimativa por razão

%217970,56291,11

299242,00278,2)( �

��RyLE

2) estimativa sem considerar a variável auxiliar (núme-ro de árvores)

a) valor médio sem considerar a variável auxiliar

hakgn

y

y

n

i

i

/5434,1238

65,4761 ��

��

hakgystyRR

/235903,12299242,00278,26291,11)( ��

196


b) variância da média sem considerar a variável auxiliar

Sendo:

2

1

2

1

2

)/(54770960,41

)(

)(ˆ hakgn

n

y

y

yV

n

i

in

i

i

��

�

�

��

�

�

c) limite de erro da estimativa sem considerar a variável auxiliar

%4036,45434,12

2723958,00278,2)( �

�

�yLESV

d) eficiência da estimativa da média por razão versus a da média sem considerar a variável auxiliar.

A eficiência é definida como o quociente entre o limite de erro da média sem considerar a variável auxiliar versus o valor obtido pelo método da razão.

8439,0217970,5

403624,4

)(

)( ��R

SV

yL

yLEEf

O resultado mostra que o limite de erro correspondente à análise sem considerar a variável auxiliar apresenta um valor correspondente a 84,39% do valor do limite de erro pelo método por razão. O método sem considerar a variável auxiliar é 18,49% mais eficiente que o por razão, visto que:

2)/(074199472,0)100

38100(

38

54770960,4)(

)(ˆ)(ˆ hakg

N

nN

n

yVyV �

�

�

�

�

hakgyVys /274199472,0074199472,0)(ˆ)( ��

197


O banco de dados do exemplo apresentado não é adequa-do para o uso da estimativa por razão, visto que, se realizada uma análise de regressão simples, ter-se-á os seguintes resul-tados:

Reta de regressão linear simples: Y = 6,7925+1,3165x

tabela 8.2 - Análise de variância da regressão.

CV GL SQ QM F

Regressão 1 88,114 88,114 39,58

Resíduo 36 80,151 2,226

Total 37 168,265

Teste para verificar a hipótese se o parâmetro linear a é diferente de zero, tal que

iiiebXaY �� ::

sn

i

in

i

i

MQ

n

x

x

x

naV Re

2

1

1

2

2

ˆ]

)(

1[)ˆ(ˆ

��

�

�

�

��

síduoMQ Reˆ

Resíduo = Quadrado médio do resíduo estimado

226,2)84210526,50

08310249,19

38

1(226,2)

38

166776

)38

166(

38

1()ˆ(ˆ

2

2

��

�

��aV

894086956,0)ˆ(ˆ�aV

1849,1403624,4

217970,5

)(

)( ��yL

yLEEf R

198


Dado que:

1836,7894086956,0

7925,6

)ˆ(ˆ

ˆ===

aV

at

Conclui-se pela rejeição de .0:0 =aH

A estimativa por razão não é recomendável quando o coe-ficiente linear ( a ) é diferente de zero.

3) estimativa por regressão

a) produção média de sementes por regressão

Dado:

;65,4761

��

�n

i

iy ;1661

��

�n

i

ix ;14,21491

��

�n

i

ii yx

;0869,61471

2

��

�n

i

iy ;00,7761

2

��

�n

i

ix 05,4100

405��X

Então:

316469979,1

38

166776

38

65,47616614,2149

)(

))((

22

1

1

2

1

11

�

�

��

�

�

�

�

��

��

�

�

�

��

n

x

x

n

yx

yx

bn

i

in

i

i

n

i

n

i

i

n

i

i

ii

Destarte:

)38

16605,4(316469979,1

38

65,476)( �� xXbyyRL

199


b) estimativa da variância de RLyRL

Dado que:

)38

65,4760869,6147)(

38

166776(

)38

65,47616614,2149(

]

)(

][

)(

[

]

))((

[

ˆ22

2

1

1

2

2

1

1

2

2

211

12

��

��

�

��

�

�

��

��

��

�

�

�

�

��

�

n

i

n

i

i

i

n

i

n

i

i

i

n

i

i

n

i

in

i

ii

n

y

yn

x

x

n

yx

yx

�

523661923,0959825,8554

906715,479.4ˆ2��

2

2

2

1

1

2

)/(547709602,437

38

65,4760869,6147

1

)(

)(ˆ hakgn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

Então:

)523661923,01(54770902,438100

38100)ˆ1)((ˆ)()(ˆ 2

��

��

�� yV

Nn

nNyV

RL

2)/(035344029,0)(ˆ hakgyV RL �

hakgyVhays RLRL /1880,0)(ˆ/)( ��

Para grandes amostras, como neste exemplo, a variância da média pode ser obtida da seguinte forma:

Da análise de variância apresentada na Tabela 8.2, tem-se:226,2ˆ

Re �sMQ

2

Re )/0363189,0(226,2)38100

38100(ˆ)()(ˆ hakgMQ

Nn

nNyV sRL ��

�

�

�

�

�

hakgxXbyyRL /1242293,12)( ��

200


c) estimativa do total RLYRL e sua variância )ˆ(ˆRLYV ( RLYRL)

kgyNY RLRL 42293,212.11242293,12100ˆ��

22244029,353035344029,0100)(ˆ)ˆ(ˆ kgyVNYV RLRL ��

kgYVYs RLRL 80,18)ˆ(ˆ)ˆ( ��

d) intervalo de confiança para o valor médioY

Limite inferior

Limite superior


e) intervalo de confiança para o valor total Y

Limite inferiorkgysty RLRL 3003,174.180,180278,242293,1212)( ��

Limite superior

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 1.174,3003 kg a 1.250,5456 kg.

201


f) limite de erro da estimativa por regressão

%144335,31242293,12

1880,00278,2)( �

�

�RLyLE

g) eficiência da estimativa por regressão versus a média sem considerar a variável auxiliar.

A eficiência é definida como o quociente entre o valor do limite de erro da média sem considerar a variável auxiliar versus o obtido pelo método da regressão.

4005,1144335,3

403624,4

)(

)( ��RLyLE

yLEEf

O resultado mostra que o limite de erro correspondente à aná-lise sem considerar a variável auxiliar apresenta um valor 40,05% maior que o obtido pelo método por regressão, demonstrando que este método possui uma eficiência superior que aquele.

h) eficiência da estimativa por regressão versus a da média por razão

A eficiência é definida como o quociente entre o limite de erro da média por razão versus ao da média estimada pelo mé-todo da regressão.

6595,1144335,3

217970,5

)(

)( ��RL

R

yLE

yLEEf

O resultado mostra que o limite de erro correspondente à média por razão apresenta um valor 65,95 % superior ao obti-do pelo método por regressão, demonstrando que este método possui uma eficiência superior que aquele.

Como a hipótese da nulidade ( 0:0 =aH ) foi rejeitada e a correlação entre a variável de interesse e variável auxiliar é de

202


72,36%, fica evidente que o processo de estimativa por regres-são é mais eficiente que os demais.

8.2 ESTIMATIVAS POR REGRESSãO CONSIDERANDO A AMOSTRA ESTRATIFICADA AO ACASO

As estimativas por regressão na amostragem estratificada podem ser obtidas pelos seguintes procedimentos:

1) as estimativas por regressão são obtidas na forma usual da amostragem estratificada considerando cada estrato separa-damente;

2) as estimativas por regressão são obtidas a partir das médias estratificadas das variáveis y e x, considerando os estra-tos conjuntamente, ou seja, usando esty e .estx

1) estimativas por regressão considerando os estratos separadamente

Este procedimento deve ser adotado quando os verdadeiros valores dos coeficientes angulares hB variam entre os estratos.

a) valor médio por regressão considerando os estratos se-paradamente

)( hhhhRL xXbyyh

��

b) valor total por regressão considerando os estratos sepa-radamente

hh RLhRL yNY �ˆ

203


c) valor médio global por regressão considerando separa-damente os estratos

��

�L

i

RLhRL hSyWy

1

d) valor total global por regressão considerando separada-mente os estratos

Da teoria da amostragem estratificada:

��

��L

h

RL

L

h

RLh

L

h

RLhRLRL hhhSSYyNyWNyNY

111

ˆˆ

e) variância do valor médio global por regressão conside-rando os estratos separadamente

A variância da média estratificada da estimativa por regres-são considerando os estratos separadamente )](),(2)([

)()(

2

00

1

2

xVbyxVbyVNn

nNWyV hhhhh

L

h hh

hhh

RLS��

��

�

, com os coeficientes angulares por estrato prefixados ( hb0 ), é dada pela expressão:

)](),(2)([)(

)(2

00

1

2

xVbyxVbyVNn

nNWyV hhhhh

L

h hh

hhh

RLS��

��

�

Como, geralmente, em inventários florestais, o tamanho das amostras por estratos ( hn ) não é pequeno, os coeficientes angulares podem ser estimados pela expressão:

h

n

i

hin

i

hi

n

i h

n

i

hi

n

i

hi

hihi

h

n

x

x

n

yx

yx

b

h

2

1

1

2

1

11

)(

))((

��

��

�

�

�

��

�

�

�

204


Por conseguinte:)( hhhhRL xXbyy

h��

Então, a expressão da variância da média estratificada da estimativa por regressão considerando os estratos separa-damente )](),(2)([

)()(

2

00

1

2

xVbyxVbyVNn

nNWyV hhhhh

L

h hh

hhh

RLS��

��

�

, com os coeficientes angulares estimados por estrato ( hb ), é:

��

�L

I

RLhRL hSyVWyV

!

2 )(ˆ)(ˆ

Dado que:

)1)(()()( 2

hh

hh

hh

hRL yVnN

nNyV ��

��

E a sua estimativa:

)ˆ1)((ˆ)()(ˆ 2

hh

hh

hh

hRLyV

nN

nNyV ��

�� ou s

hh

hhRL MQ

nN

nNyV

h Reˆ)()(ˆ �

�

2) estimativas por regressão a partir das médias es-tratificadas das variáveis y e x, considerando os estratos conjuntamente, ou seja, usando esty e .estx

Este procedimento deve ser adotado quando não houver grande variação entre os verdadeiros valores dos coeficientes angulares hB entre os estratos.

a) valor médio por regressão considerando conjuntamente os estratos

Dado que: ��

�L

I

hhEs txWx

!

e ��

�L

I

hhEst yWy!

e ��

�L

I

hhEs txWx

!

e ��

�L

I

hhEst yWy!

, então:

)( EstcEstRL xXbyyC

��

205


O coeficiente da regressão cb é obtido considerando o conjunto total dos dados:

��

�

��

�

�

�

�

�

��

�

��

�

��

�

�

L

h h

n

i

hin

i

hi

hh

hh

L

h h

n

i

ih

n

i

hin

i

hihi

hh

hh

c

n

x

xnn

fW

n

yx

yxnn

fW

bh

i

hh

h

1

2

1

1

22

1

11

1

2

]}

)(

[)1(

)1({

]}

))((

[)1(

)1({

Se a alocação for proporcional e no caso de grandes amos-tras, substituir )1( −hn por hn , resultará:

��

�

��

�

�

�

�

�

��

�

�

�

�

L

h h

n

i

hin

i

hi

L

h h

n

i

ih

n

i

hin

i

hihi

c

n

x

x

n

yx

yx

bh

i

hh

h

1

2

1

1

2

1

11

1'

]

)(

[

]

))((

[

Pois:n

n

N

N hh �

��

�

��

�

�

�

�

�

��

�

�

�

�

L

h h

n

i

hin

i

hi

L

h h

n

i

ih

n

i

hin

i

hihi

c

n

x

x

n

yx

yx

bh

i

hh

h

1

2

1

1

2

1

11

1'

]

)(

[

]

))((

[

Pois:n

n

N

N hh �

b) valor total por regressão considerando conjuntamente os estratos

CC RLRL yNY ��ˆ

c) variância do valor médio global por regressão conside-rando conjuntamente os estratos

A fórmula da variância da média estratificada da estimativa por regressão )](),(2)([

)()(

2

00

1

2

xVbyxVbyVNn

nNWyV hhhhh

L

h hh

hhh

RLS��

��

�

, considerando os coeficientes angulares por estrato hb0 prefixados, é:

206


)](ˆ),(ˆ2)(ˆ[)(

)(ˆ 2

0

1

2

xVbyxVbyVNn

nNWyV hohhhh

L

h hh

hhhRLC

��

� ��

Quando o valor do coeficiente angular é obtido através da amostra, tem-se:

)](ˆ),(ˆ2)(ˆ[)(

)(ˆ 2

0

1

2

xVbyxVbyVNn

nNWyV hohhhh

L

h hh

hhhRLC

��

� ��

])(),(2)()[()(1

2

��

��

�L

h

hchch

hh

hhRL xVbyxVbyV

nN

nWyV

C

2

E sua estimativa:

])(ˆ),(ˆ2)(ˆ[)1(

)(ˆ

1

22

��

��

�L

h

hchch

h

hhRL xVbyxVbyV

n

fWyV

C

exercício 8.2

Um produtor florestal possui uma área de 1200 ha. A área apresenta três tipos florestais (três estratos) com ocorrência de castanha do brasil. As árvores de castanha do brasil estão iden-tificadas e plotadas em um mapa logístico, o que permite co-nhecer o número total populacional de árvores por estrato. Os estratos estão subdivididos em unidades de 1 ha.

Os dados foram simulados considerando uma amostra sim-ples ao acaso de uma população binormal por estrato ( 1n = 40,

2n = 39 e 3n = 38). A Tabela 8.3 apresenta os vetores de médias e matrizes de covariâncias por estrato considerando a produ-ção de sementes de castanha (y) e o número de árvores (x) por parcela de 1 ha. A Tabela 8.4 apresenta os dados das amostras simples ao acaso por estrato ( 1n = 40, 2n = 39 e 3n = 38). A Tabe-la 8.5 apresenta as informações populacionais sobre a variável auxiliar (número de árvores).

207


1) Obter as estimativas por regressão por estrato e compa-rar os resultados sem considerar a variável auxiliar número de árvores.

2) Efetuar a análise global para as estimativas por regres-são considerando os estratos separadamente e comparar os re-sultados sem considerar a variável auxiliar número de árvores.

3) Obter a análise global para as estimativas por regressão considerando os estratos conjuntamente, ou seja, a partir de Esty e Estx , e comparar os resultados sem considerar a variável auxi-liar número de árvores.

4) Comparar os resultados das estimativas por regressão considerando os estratos separadamente versus os estratos conjuntamente ( Esty e Estx ).

5) Discutir e concluir sobre os resultados principalmente sem usar a variável auxiliar número de árvores.

tabela 8.3 - Vetores das médias e as matrizes de covariâncias da população.

Est Vetor de médias Matriz de covariância

I 30

10

16 7,2

7,2 4

II 20

18

9 5,7

5,7 5

III 21

5

4 2,3

2,3 2

8

20

8

20

8

20

8

20

8

20

8

20

8

20

8

20

8

20

8

20

8

20

8

20

208


tabela 8.4 - Dados das amostras simples ao acaso por estrato.

UAEstrato I Estrato II Estrato III

y x y x y x 1 28,37 10 21,8 6 15,47 62 26,69 9 21,0 9 15,14 83 40,84 16 23,5 11 12,90 44 34,03 11 19,6 8 14,24 35 23,61 8 22,6 9 15,37 66 28,03 9 17,3 5 12,71 57 25,43 9 18,3 8 9,66 38 33,16 11 21,9 10 11,29 39 37,17 14 21,5 7 7,89 6

10 38,26 14 25,5 12 8,71 411 28,12 9 16,7 8 14,04 612 23,10 8 19,3 8 11,55 513 32,21 8 21,5 10 13,79 314 26,30 10 18,0 6 13,25 615 29,39 8 21,4 9 13,29 716 27,28 8 27,4 12 14,91 817 29,08 9 21,3 3 14,33 618 29,33 11 19,2 11 11,18 519 29,91 12 18,5 7 15,37 620 36,48 11 17,9 7 11,12 421 33,42 12 25,6 11 14,36 722 29,52 11 23,4 10 13,91 823 34,08 13 25,2 12 11,33 524 22,18 7 23,8 10 12,79 425 29,03 11 23,1 9 10,11 726 28,43 9 18,9 6 12,79 427 32,69 12 25,5 12 15,87 728 24,76 8 20,9 8 11,88 429 34,00 11 22,1 10 12,38 530 26,66 9 16,8 5 12,95 431 31,66 10 19,3 7 11,55 732 34,26 13 18,1 8 13,58 633 30,45 11 16,8 6 12,03 634 32,93 11 20,6 13 14,02 635 25,86 9 21,6 8 9,37 436 29,59 10 20,5 9 14,15 537 30,32 10 19,3 6 12,38 538 29,91 10 13,3 3 11,57 539 28,33 10 20,2 840 27,59 9

209


tabela 8.5 - Número de árvores por estrato (População).

Estrato Área em ha N0 de árvores por estrato N0 de árvores/ha

I 600 6.240,0 10,40

II 360 3.060,0 8,50

III 240 1.248,0 5,20

1) estimativas por regressão por estrato e comparação dos resultados sem considerar a variável auxiliar número de árvores

Sabe-se que:

;5,0

200.1

6001

��ha

haW ;3,0

200.1

3602

��ha

haW 2,0

200.1

2403

��ha

haW

;6001

�N 3602

�N ; 2403

�N

a) estimativa por regressão para o estrato Ia1) produção média de sementes por regressão

Dado:

;460,202.11

1

1��

�

n

i

iy ;4111

1

1��

�

n

i

ix ;2,624.121

1

11��

�

n

i

ii yx

;649,821.361

1

2

1��

�

n

i

iy ��

�1

1

2

1 369.4

n

i

ix ;240.61

1

1��

�

N

i

ix ;6001 �N

haárvoresN

x

X

N

i

i

/4,10600

240.6

1

1

1

1

1

��

��

210


Então:

1

2

1

1

1

2

1

1 1

1

1

1

1

1

1

)(

))((

1

1

1

11

n

x

x

n

yx

yx

bn

i

in

i

i

n

i

n

i

i

n

i

i

ii

��

��

�

�

�

��

�

�

�

842257236,1

40

411369.4

40

46,202.14112,624.12

21 �

�

��

�b

)40

4114,10(842257236,1

40

46,202.1)( 11111

�� xXbyyRL

hakgyRL

/29178215,301

�

a2) estimativa da variância de

Dado:

��

��

��

�

�

�

�

��

�

��

�

�

1

1

1

1

11

1

1 1

1

2

12

1

1 1

1

2

12

1

2

1

1

1

1

1

1

11

2

1

]

)(

][

)(

[

]

))((

[

ˆ

n

i

n

i

i

i

n

i

n

i

i

i

n

i

i

n

i

in

i

ii

n

y

yn

x

x

n

yx

yx

�

735165376,0

)40

46,202.1649,821.36)(

40

411369.4(

]40

46,202.14112,624.12[

ˆ22

2

2

1�

��

��

��

2

2

1

1

2

1

1

1

2

1

1 )/(27942846,1739

40

46,202.1649,36821

1

)(

)(ˆ

1

1

hakgn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

1

2

1

1

1

2

1

1 1

1

1

1

1

1

1

)(

))((

1

1

1

11

n

x

x

n

yx

yx

bn

i

in

i

i

n

i

n

i

i

n

i

i

ii

��

��

�

�

�

��

�

�

�

842257236,1

40

411369.4

40

46,202.14112,624.12

21 �

�

��

�b

)40

4114,10(842257236,1

40

46,202.1)( 11111

�� xXbyyRL

hakgyRL

/29178215,301

�

211


Então:

)735165376,01(27942846,1740600

40600)ˆ1)((ˆ)()(ˆ 2

11

11

11

1��

�

��

�� yV

nN

nNyV

RL

2)/(106777788,0)(ˆ

1hakgyV RL �

hakgyVhays RLRL /326768708,0)(ˆ/)(11

��

a3) estimativa do total

1

2

1

1

1

2

1

1 1

1

1

1

1

1

1

)(

))((

1

1

1

11

n

x

x

n

yx

yx

bn

i

in

i

i

n

i

n

i

i

n

i

i

ii

��

��

�

�

�

��

�

�

�

842257236,1

40

411369.4

40

46,202.14112,624.12

21 �

�

��

�b

)40

4114,10(842257236,1

40

46,202.1)( 11111

�� xXbyyRL

hakgyRL

/29178215,301

�e sua variância

kgyNY RLRL 06929,175.1829178215,30600ˆ11

��

222 00368,440.38106777788,0600)(ˆ)ˆ(ˆ11

kgyVNYV RLRL ��

kgyVYs RLRL 0612243,196)ˆ(ˆ)ˆ(11

��

kgyNY RLRL 06929,175.1829178215,30600ˆ11

��

222 00368,440.38106777788,0600)(ˆ)ˆ(ˆ11

kgyVNYV RLRL ��

kgyVYs RLRL 0612243,196)ˆ(ˆ)ˆ(11

��

a4) intervalo de confiança do valor médio populacional 1Y

Limite inferiorhakgysty

RLRL/630958,29326768708,00223,229178215,30)(

11��

Limite superior

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato I encontra-se no in-tervalo de 29,630958 kg de sementes/ ha a 30,61855 kg de se-mentes/ ha.

a5) intervalo de confiança para o valor total 1Y

Limite inferiorkgYstY

RLRL57468,778.17061224,1960223,206929,175.18)ˆ(ˆ

11

��

212


Limite superiorkgYstY

RLRL5639,571.180612243,1960223,206929,175.18)ˆ(ˆ

11�� 18.175,06929 + 2,0223 x 196,0612243 = 18.571,5639 kg

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato I encontra-se no intervalo de 17.778,57468 kg de sementes a 18.571,5639 kg de sementes.

a6) limite de erro da estimativa por regressão

%1815,210029178215,30

326768708,00223,2)()(

1

1

1��

��

�

�

RL

RL

RLy

ystyLE

a7) limite de erro da estimativa sem considerar a variável auxiliar número de árvores

Dado:

hakgn

y

y

n

i

i

/0615,3040

46,202.1

1

1

1

1

1

��

��

2

1

11

1

1

1)/(403186664,0)

600

40600(

40

27942846,17)(

)(ˆ)(ˆ hakg

N

nN

n

yVyV �

��

��

)/(634970,0403186664,0)(ˆ)( 11 hakgyVys ��

Então,

%2716,41000615,30

634970,00223,2100

)()(

1

1

1 ��

�

��

�

�

y

ystyLE SV

a8) eficiência da estimativa da média por regressão versus a da média sem considerar a variável auxiliar número de árvores

A eficiência é definida como o quociente entre o limite de erro sem considerar a variável auxiliar versus o valor obtido pelo método da regressão.

213


O resultado do estrato I mostra que o limite de erro corres-pondente à análise sem considerar a variável auxiliar apresenta um valor 95,81% superior ao encontrado pelo método por regres-são, demonstrando ser este método mais eficiente que aquele.

b) estimativa por regressão para o estrato II

Dado:

;2,8092

1

2��

�n

i

iy ;9,124.171

2

2��

�i

iy ;3272

1

2��

�

n

i

ix ;060.32

1

2��

�N

i

ix

;969.21

2

2��

�i

ix ;8,987.62

1

22��

�

n

i

ii yx ;3602

�N

haárvoresN

x

X

N

i

i

/5,8360

060.3

2

1

2

2

2

��

��

2n

2n

b1) produção média de sementes por regressão

893229519,0

39

327969.2

39

2,8093278,987.6

)(

))((

ˆ2

2

2

1

2

1

2

2

1 2

1

2

1

2

21

22

2

2

22

�

�

��

�

�

�

�

��

��

�

�

�

��

n

x

x

n

yx

yx

bn

i

in

i

i

n

i

n

i

i

n

i

i

ii

)39

3275,8(893229519,0

39

2,809)( 22222

�� xXbyyRL

hakgxXbyyRL /85178289,20)( 22222��

9581,11815,2

2716,4

)(

)(

1

1 ��RL

SV

yLE

yLEEf

214


b2) estimativa da variância de

1

2

1

1

1

2

1

1 1

1

1

1

1

1

1

)(

))((

1

1

1

11

n

x

x

n

yx

yx

bn

i

in

i

i

n

i

n

i

i

n

i

i

ii

��

��

�

�

�

��

�

�

�

842257236,1

40

411369.4

40

46,202.14112,624.12

21 �

�

��

�b

)40

4114,10(842257236,1

40

46,202.1)( 11111

�� xXbyyRL

hakgyRL

/29178215,301

�

Dado que:

��

��

��

�

�

�

�

��

�

��

�

�

2

2

2

2

22

2

1 2

1

2

22

2

1 2

1

2

22

2

2

2

1

2

1

2

1

22

2

2

]

)(

][

)(

[

]

))((

[

ˆ

n

i

n

i

i

i

n

i

n

ii

n

i

i

n

i

in

i

ii

n

y

yn

x

x

n

yx

yx

�

541127912,0

)39

2,8099,124.17)(

39

327969.2(

]39

2,8093278,987.6[

ˆ22

2

2

2 �

��

��

��

2

2

2

2

2

1

2

1

2

2

)/(816774629,838

39

2,8099,124.17

1

)(

)(ˆ

2

2

2hakg

n

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

Então:

)541127912,01(816774629,839360

39360)ˆ1)((ˆ)()(ˆ 2

22

22

22

2��

�

��

�� yV

nN

nNyV

RL

22

22

22

22 )/(092499483,0)ˆ1)((ˆ)()(ˆ2

hakgyVnN

nNyV

RL��

��

hakgyVhays RLRL /304137276,0)(ˆ/)(22

��

b3) estimativa do total kgyNY RLRL 64184,506.785178289,20360ˆ22 2 ��

222

2 933,987.11092499483,0360)(ˆ)ˆ(ˆ22

kgyVNYV RLRL ��

kgYVYs RLRL 4894196,109)ˆ(ˆ)ˆ(22

��

e sua variância )ˆ(ˆ2RlYV ( kgyNY RLRL 64184,506.785178289,20360ˆ

22 2 ��

222

2 933,987.11092499483,0360)(ˆ)ˆ(ˆ22

kgyVNYV RLRL ��


��

)

kgyNY RLRL 64184,506.785178289,20360ˆ22 2 ��

222

2 933,987.11092499483,0360)(ˆ)ˆ(ˆ22

kgyVNYV RLRL ��


��

215


b4) intervalo de confiança do valor médio populacional 2Y


RLRL/23581368,20304137276,00253,285178289,20)(

22

��

Limite superior hakgysty RLRL /46775212,21304137276,00253,285178289,20)(

22��

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato II encontra-se no in-tervalo de 20,23581368 kg de sementes/ ha a 21,46775212 kg de sementes/ ha.

b5) intervalo de confiança do valor total populacional 2Y

Limite inferiorkgYstY

LRLR892918,284.74894196,1090253,264184,506.7)ˆ(ˆ

22

��

Limite superiorkgYstY

RLLR390762,728.74894196,1090253,264184,506.7)ˆ(ˆ

22��

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato II encontra-se no intervalo de 7.284,892918 kg de sementes a 7.728,390762 kg de sementes.

b6) limite de erro da estimativa por regressão

%9540,210085178289,20

304137276,00253,2100

)()(

2

2

2��

�

��

�

�

RL

RL

RLy

ystyLE

b7) limite de erro da estimativa sem considerar a variável auxiliar número de árvores

216


Dado:

hakgn

y

y

n

i

i

/748718,2039

2,809

2

1

2

2

2

��

��

2

2

22

2

2

2)/(201580,0)

360

39360(

39

8167746296,8)(

)(ˆ)(ˆ hakg

N

nN

n

yVyV �

��

��

)/(448977,0201580,0)(ˆ)(22

hakgyVys ��

Então:

%3608,4100851783,20

448977,00253,2)()(

2

2

2��

�

�

�

�

y

ystyLE

S V

b8) eficiência da estimativa da média por regressão versus a da média sem considerar a variável auxiliar número de árvores


4762,19540,2

3608,4

)(

)(

2

2 ��RL

SV

yLE

yLEEf

O resultado do estrato II mostra que o limite de erro cor-respondente à análise sem considerar a variável auxiliar apre-senta um valor 47,62% superior ao encontrado pelo método por regressão, demonstrando ser este método mais eficiente que aquele.

c) estimativa por regressão para o estrato III

c1) produção média de sementes por regressão

217


Dado:

;23,4833

1

3��

�

n

i

iy ;0,2033

1

3��

�

n

i

ix ;27,623.23

1

33��

�

n

i

ii yx

;475,285.63

1

2

3��

�

n

i

iy ;0,161.11

2

3��

�i

ix ;248.13

1

3��

�

N

i

ix ;2403

�N

haárvoresN

x

X

N

i

i

/2,5240

248.1

3

1

3

3

3

��

��

3n

Então:

38

203161.1

38

23,483203.27,623.2

)(

))((

2

3

2

1

3

1

2

3

1 3

1

3

1

3

33

33

3

3

33

�

��

�

�

�

�

��

��

�

�

�

��

n

x

x

n

yx

yx

bn

i

in

i

i

n

i

n

i

i

n

i

i

ii

546088002,03 �b

hakgxXbyyRL

/63897697,12)38

2032,5(546088002,0

38

23,483)(

33333��

c2) estimativa da variância de

38

203161.1

38

23,483203.27,623.2

)(

))((

2

3

2

1

3

1

2

3

1 3

1

3

1

3

33

33

3

3

33

�

��

�

�

�

�

��

��

�

�

�

��

n

x

x

n

yx

yx

bn

i

in

i

i

n

i

n

i

i

n

i

i

ii

546088002,03 �b

hakgxXbyyRL

/63897697,12)38

2032,5(546088002,0

38

23,483)(

33333��

Dado:

��

��

��

�

�

�

�

��

�

��

�

�

3

3

3

3

33

3

1 3

1

2

32

3

1 3

1

2

32

3

2

3

1

3

1

3

1

33

2

3

]

)(

][

)(

[

]

))((

[

ˆ

n

i

n

i

i

i

n

i

n

ii

n

i

i

n

i

in

i

ii

n

y

yn

x

x

n

yx

yx

�

162549887,0

)38

23,483475,285.6)(

38

203161.1(

]38

23,48320327,623.2[

ˆ22

2

2

3 �

��

��

��

2

2

3

3

2

1

3

1

2

3

3 )/(795744737,337

38

23,483475,285.6

1

)(

)(ˆ

3

3

hakgn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

�

218

Amostragem em inventário florestal Waldenei Travassos de Queiroz�

��

�

��

�

�

�

�

��

�

��

�

�

3

3

3

3

33

3

1 3

1

2

32

3

1 3

1

2

32

3

2

3

1

3

1

3

1

33

2

3

]

)(

][

)(

[

]

))((

[

ˆ

n

i

n

i

i

i

n

i

n

ii

n

i

i

n

i

in

i

ii

n

y

yn

x

x

n

yx

yx

�

162549887,0

)38

23,483475,285.6)(

38

203161.1(

]38

23,48320327,623.2[

ˆ22

2

2

3 �

��

��

��

2

2

3

3

2

1

3

1

2

3

3 )/(795744737,337

38

23,483475,285.6

1

)(

)(ˆ

3

3

hakgn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

�

Então:

)162549887,01(795744737,338240

38240)ˆ1)((ˆ)()(ˆ 2

33

33

33

3��

�

��

�� yV

nN

nNyV RL

22

33

33

33 )/(070406454,0)ˆ1)((ˆ)()(ˆ3

hakgyVnN

nNyV

RL��

��

hakgyVhays RLRL /265342146,0)(/)(33

��

�

c3) estimativa do total kgyNY RLRL 354473,033.363897697,12240ˆ333

��

222

3 757504,058.4070406454,0240)(ˆ)ˆ(ˆ33

kgyVNYV RLRL ��


��

e sua variância

kgyNY RLRL 354473,033.363897697,12240ˆ333

��

222

3 757504,058.4070406454,0240)(ˆ)ˆ(ˆ33

kgyVNYV RLRL ��


��kgyNY RLRL 354473,033.363897697,12240ˆ

333��

222

3 757504,058.4070406454,0240)(ˆ)ˆ(ˆ33

kgyVNYV RLRL ��


��

c4) intervalo de confiança do valor médio populacional 3Y


RLRL/10099577,12265342146,00275,263897697,12)(

33

��

Limite superior hakgysty RLRL /17695817,13265342146,00275,263897697,12)(

33�� 12,63897697 + 2,0275 x 0,265342146 = 13,17695817 kg/ha

219


Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional do estrato III encontra-se no in-tervalo de 12,10099577 kg/ ha a 13,17695817 kg/ ha.

c5) intervalo de confiança do valor total populacional 3Y

Limite inferior kgYstY RLRL 185735,904.27083786,630275,2354473,033.3)ˆ(ˆ

33�� 3.033,354473 – 2,0275 x 63,7083786 = 2.904,185735 kg

Limite superior kgYstY

RLRL523211,162.37083786,630275,2354473,033.3)ˆ(ˆ

33�� 3.033,354473 + 2,0275 x 63,7083786 = 3.162,523211 kg

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional do estrato III encontra-se no inter-valo de 2.904,185735 kg a 3.162,523211 kg.

c6) limite de erro da estimativa por regressão

%2565,410063897697,12

265342146,00275,2100

)()(

3

3

3��

�

��

�

�

RL

RL

RLy

ystyLE

c7) limite de erro da estimativa sem considerar a variável auxiliar número de árvores

Dado:

hakgn

y

y

n

i

i

/716579,1238

23,483

3

1

3

3

3

��

��

2

3

33

3

33 )/(084072416,0)

240

38240(

38

795744737,3)(

)(ˆ)(ˆ hakg

N

nN

n

yVyV �

��

��

)/(289952,0084072416,0)(ˆ)(33

hakgyVys ��

220


Então:

c8) eficiência da estimativa da média por regressão versus a da média sem considerar a variável auxiliar número de árvores


0861,12565,4

6229,4

)(

)(

3

3 ��RL

SV

yLE

yLEEf

O resultado do estrato III mostra que o limite de erro corres-pondente à análise sem considerar a variável auxiliar apresenta um valor 8,61 % superior ao encontrado pelo método por regres-são, demonstrando ser este método mais eficiente que aquele.

2) efetuar a análise global para as estimativas por re-gressão considerando os estratos separadamente e compa-rar os resultados sem considerar a variável auxiliar número de árvores

a) valor médio global por regressão considerando separa-damente os estratos

Dado:

)( hhhhRL xXbyyh

��

Então:291782,30)(

11111�� xXbyy

RL

851783,20)( 22222�� xXbyyRL

638977,12)( 33333�� xXbyyRL

291782,30)(11111

�� xXbyyRL

851783,20)( 22222�� xXbyyRL

638977,12)( 33333�� xXbyyRL

221


291782,30)(11111

�� xXbyyRL

851783,20)( 22222�� xXbyyRL

638977,12)( 33333�� xXbyyRL

Portanto:

��

�L

i

RLhRL hSyWy

1

638977,12200.1

240851783,20

200.1

360291782,30

200.1

600��

SRLy

hakgySRL

/929222,23�

b) valor total global por regressão considerando separada-mente os estratos

354473,033.364184,506.706929,175.18ˆˆ

1

��

L

h

RLRL hSYY

kgYSRL

0656,715.28ˆ �

c) variância do valor médio global por regressão conside-rando os estratos separadamente

��

�L

I

RLhRL hSyVWyV

!

2)(ˆ)(ˆ

070406454,0)200.1

240(092499483,0)

200.1

360(106777788,0)

200.1

600()(ˆ 222 ��

SRLyV

2)/(03783566,0)(ˆ hakgyVS

RL�

)/(194514,003783566,0)(ˆ)( hakgyVysSS

RLRL ��

d) limite de erro considerando os estratos separadamente

%6257,1100929222,23

194514,000,2100

)(��

�

��

�

�

S

S

RL

RL

Sy

ystLE

222


e) limite de erro sem usar a variável auxiliar número de árvores

Dado:798681,23

38

23,483

200.1

240

39

2,809

200.1

360

40

46,1202

200.1

600

1

��

L

h

hhEstyWy

132336,0)(ˆ

1

2

��

L

h h

hh

n

yVW

0438,12)(ˆ

1

��

h

L

h

hyVW

0438,121200

1132336,0)(ˆ1)(ˆ

)(ˆ

1 1

2

��

L

h

h

L

h

h

h

hh

EstyVW

Nn

yVWyV

2)/(122299,0)(ˆ hakgyV Est �

hakgyVys EstEst /349713,0122299,0)(ˆ)( ��

Então:

%9389,2100798681,23

349713,000,2100

)(��

�

��

�

�

Est

Est

RL

RL

SVy

ystLE

f) eficiência da estimativa da média por regressão com es-tratos separados

8078,16257,1

9389,2

)(

)(��

SRLS

EstSV

yLE

yLEEf

versus a calculada sem considerar a vari-ável auxiliar número de árvores

8078,16257,1

9389,2

)(

)(��

SRLS

EstSV

yLE

yLEEf

.

A eficiência é definida como o quociente entre o limite de erro da estimativa da média sem considerar a variável auxiliar número de árvores versus o calculado com estratos separados.

8078,16257,1

9389,2

)(

)(��

SRLS

EstSV

yLE

yLEEf

O resultado mostra que a análise com os estratos sepa-rados apresenta uma eficiência de 80,78% ao encontrado sem considerar a variável auxiliar número de árvores.

223


3) Análise global para as estimativas por regressão considerando os estratos conjuntamente, ou seja, a partir de Esty e Estx . comparar os resultados sem considerar a va-riável auxiliar número de árvores

a) coeficiente de regressão estimado considerando os es-tratos conjuntamente

Sabe-se que:

��

�

��

�

�

�

�

�

��

�

��

�

��

�

�

L

h h

n

i

hin

i

hi

hh

hh

L

h h

n

i

hi

n

i

hin

i

hihi

hh

hh

c

n

x

xnn

fW

n

yx

yxnn

fW

bh

h

hh

h

1

2

1

1

2

2

1

11

1

2

]}

)(

[)1(

)1({

]}

))((

[)1(

)1({

Dado que:

;460,202.11

1

1��

�

n

i

iy ;411

1

1

1��

�

n

i

ix ;2,624.12

1

1

11��

�

n

i

ii yx

;649,821.361

1

2

1��

�

n

i

iy �

�

�1

1

2

1369.4

n

i

ix

Seja:

321

321

CCC

AAAbc ++

++=

Tal que:

]

))((

[)1(

)1(

1

1

1

1

1

1

11

11

1

2

1

1

11

1

n

yx

yxnn

fWA

n

i

i

n

i

in

i

ii

��

��

�

��

��

224


0402236,0)40

46,202.14112,624.12(

3940

)600

401(5,0

2

1 �

�

�

�

�

�A

]

)(

[)1(

)1(

1

2

1

1

1

2

1

11

1

2

11

1

1

n

x

xnn

fWC

n

i

in

i

i

��

�

��

��

0218339,0)40

411369.4(

3940

)600

401(5,0 2

2

1 ��

�

�

�C

;2,8092

1

2��

�

n

i

iy ;3272

1

2��

�

n

i

ix ;8,987.62

1

22��

�

n

i

ii yx

;9,124.171

2

2��

�i

iy ;969.21

2

2��

�i

ix

]

))((

[)1(

)1(

2

1

2

1

2

1

22

22

2

2

2

2

22

2

n

yx

yxnn

fWA

n

i

i

n

i

in

i

ii

��

�

��

��

0109907,0)39

)2,8093278,987.6(

3839

)360

391(3,0

2

2�

�

�

�

�

�A

]

)(

[)1(

)1(

2

2

1

2

1

2

2

22

2

2

2

2

2

2

n

x

xnn

fWC

n

i

in

i

i

��

�

��

��

0123045,0)39

327969.2(

3839

)360

391(3,0 2

2

2 ��

�

�

�C

;23,4833

1

3��

�

n

i

iy ;0,2033

1

3��

�

n

i

ix ;27,623.23

1

33��

�

n

i

ii yx

;475,285.63

1

2

3��

�

n

i

iy ;0,161.11

2

3��

�i

ix

2n 2n

3n

225


b) valor médio global por regressão considerando os estra-tos conjuntamente

Sabe-se que:

721306,838

203

200.1

240

39

327

200.1

360

40

411

200.1

600

1

��

L

h

hhEst xWx

798681,2338

23,483

200.1

240

39

2,809

200.1

360

40

46,1202

200.1

600

1

��

L

h

hhEstyWy

]

))((

[)1(

)1(

3

1

3

1

3

1

33

33

3

2

3

3

33

3

n

yx

yxnn

fWA

n

i

i

n

i

in

i

ii

��

�

��

��

001001008,0)38

)23,48320327,623.2(

3738

)240

381(2,0 2

3�

��

�

�

�A

]

)(

[)1(

)1(

3

2

1

3

1

2

3

33

3

2

3

3

3

3

n

x

xnn

fWC

n

i

in

i

i

��

�

�

��

��

00183305,0)38

203161.1(

3738

)240

381(2,0 2

2

3 ��

�

�C

321

321

CCC

AAAbc

��

��

4515764,100183305,00123045,00218339,0

001001008,00109907,00402236,0�

��

��cb

haárvoresN

x

X

N

i

i

/79,8240360600

248.1060.3240.61�

��

��

��

226


Então:

c) valor total global por regressão considerando os estratos conjuntamente

d) variância do valor médio global por regressão conside-rando os estratos conjuntamente

Dado que:

Sendo:

)( EstcEstRL xXbyyC

��

)721306,879,8(451576403,1798681,23 ��CRLy

hakgyCRL /898396,23�

kgyNYCC RLRL 0747,678.28898396,23200.1ˆ

��

])(ˆ),(ˆ2)(ˆ[)1(

)(ˆ

1

2

2

��

��

�

L

hhchch

h

hh

RL xVbyxVbyVn

fWyV

C

321)(ˆ KKKyV

CRL

��

)](ˆ),(ˆ2)(ˆ[)1(

1

2

11

1

1

2

1

1 xVbyxVbyVn

fWK cc ��

�

�

)74295,34515764,189599,64515764,1227942,17(40

)600

401(5,0

2

2

1��

�

�K

03001822,01 �K

)](ˆ),(ˆ2)(ˆ[)1(

2

2

22

2

2

2

2

2 xVbyxVbyVn

fWK cc ��

�

�

)97976,54515764,134130,54515764,1281677,8(39

)360

391(3,0

2

2

2��

�

�K

01216087,02 �K

)](ˆ),(ˆ2)(ˆ[)1(

3

2

33

3

3

2

3

3 xVbyxVbyVn

fWK cc ��

�

�

)06899,24515764,112985,14515764,1279573,3(38

)240

381(2,0

2

2

3��

�

�K

0043191834,03

�K

2

321 )/(046498273,0)(ˆ hakgKKKyVC

RL ��

hakgyVysCC RLRL /215635,0046498273,0)(ˆ)( ��

227


e) limite de erro considerando os estratos conjuntamente

f) eficiência da estimativa da média por regressão conside-rando os estratos conjuntamente ( )( EstcEstRL xXbyy

C��

)721306,879,8(451576403,1798681,23 ��CRLy


) versus a calculada sem considerar a variável auxiliar

A eficiência é definida como o quociente entre o limite de erro da estimativa da média sem considerar a variável auxiliar número de árvores versus o calculado considerando os estratos conjuntamente.

6286,18046,1

9389,2

)(

)(��

CRL

EstSV

yLE

yLEEf

)](ˆ),(ˆ2)(ˆ[)1(

1

2

11

1

1

2

1

1 xVbyxVbyVn

fWK cc ��

�

�

)74295,34515764,189599,64515764,1227942,17(40

)600

401(5,0

2

2

1��

�

�K

03001822,01 �K

)](ˆ),(ˆ2)(ˆ[)1(

2

2

22

2

2

2

2

2 xVbyxVbyVn

fWK cc ��

�

�

)97976,54515764,134130,54515764,1281677,8(39

)360

391(3,0

2

2

2��

�

�K

01216087,02 �K

)](ˆ),(ˆ2)(ˆ[)1(

3

2

33

3

3

2

3

3 xVbyxVbyVn

fWK cc ��

�

�

)06899,24515764,112985,14515764,1279573,3(38

)240

381(2,0

2

2

3��

�

�K

0043191834,03

�K

2

321 )/(046498273,0)(ˆ hakgKKKyVC

RL ��

hakgyVysCC RLRL /215635,0046498273,0)(ˆ)( ��

%8046,1100898396,23

215635,000,2100

)(��

��

�

�

C

C

RL

RL

Cy

ystLE

228


Sendo:

O resultado mostra que a análise considerando os estratos conjuntamente (função de Esty e Estx ) apresenta uma eficiência de 62,86% ao encontrado sem considerar a variável auxiliar nú-mero de árvores.

4) comparar os resultados das estimativas por regres-são considerando os estratos separadamente ( )( EstcEstRL xXbyy

C��

)721306,879,8(451576403,1798681,23 ��CRLy


) versus usando os estratos conjuntamente ( )( EstcEstRL xXbyy

C��

)721306,879,8(451576403,1798681,23 ��CRLy


)

A eficiência é definida como o quociente entre o limite de erro da estimativa da média por regressão obtida com os estra-tos conjuntamente )( EstcEstRL xXbyy

C��

)721306,879,8(451576403,1798681,23 ��CRLy


versus o calculado com estratos sepa-rados )( EstcEstRL xXbyy

C��

)721306,879,8(451576403,1798681,23 ��CRLy


.

O resultado mostra que a análise com os estratos sepa-rados apresenta uma eficiência 8,61% superior ao encontrado pelo método por regressão que considera os estratos conjunta-mente (função de Esty e Estx ).

É importante ressaltar que os resultados deste exemplo revelaram uma grande vantagem quanto ao uso da estimativa por regressão em relação à análise sem considerar a variável auxiliar número de árvores.

Por outro lado, o uso da estimativa pela regressão na amos-tragem estratificada com os estratos separados é recomendado quando existe variação entre os verdadeiros coeficientes de re-

%9389,2100798681,23

349713,000,2100

)(��

�

��

�

�

Est

Est

RL

RL

SVy

ystLE

0861,16257,1

8046,1

)(

)(��

S

C

RLS

RLC

yLE

yLEEf

229


gressão, enquanto que a análise em função de Esty e Estx deve ser aplicada quando esses coeficientes forem homogêneos.

Os valores encontrados para os coeficientes de regres-são para os três estratos apresentaram certa variabilidade ( ;842257,11 =b ;893230,0ˆ

2 =b 546088,03 =b ), o que resultou em uma eficiência de 8,61 % para o método de regressão com os estratos separados em relação ao obtido com a análise conjunta dos estratos (função de Esty e Estx ).

cApítulo 9

AmostrAgem por conglomerAdo

Define a amostragem por conglomerados, descrevendo os parâmetros populacionais e os seus estimadores. Apresenta as metodologias referentes aos conglomerados em estágio único, em dois estágios e também em três estágios. Apresenta a teoria sobre a amostragem por conglomerados em estágio único e em dois estágios com unidades de grandezas iguais e desiguais, estendendo esta concepção quando ocorrer proporções. Mostra a obtenção dos componentes de variâncias no modelo inteira-mente ao acaso através do método dos momentos ou da análise de variância. Discorre sobre a ocorrência de estimativa negativa do componente de variância entre conglomerados. Apresenta a análise de conglomerados em dois estágios considerando a ocorrência de tipologias diferentes na subparcela, assim como quando ocorrer uma variável auxiliar. Mostra exemplos aplicati-vos sobre todos os temas abordados.

233

Amostragem por conglomerado

A amostragem por conglomerados ou grupos é uma va-riação de qualquer processo de amostragem que, em vez de utilizar unidades de amostra individuais, usa um grupo ou con-glomerado de pequenas subparcelas. As subparcelas também são denominadas subunidades ou unidades secundárias.

Quando os conglomerados são selecionados aleatoria-mente na floresta, pode-se definir que a amostragem consiste em reunir em grupos as subparcelas que em uma amostra intei-ramente aleatória se dispersariam na floresta. Dessa forma, as subparcelas se restringem a uma área específica denominada subpopulação. Esse procedimento torna o trabalho de campo mais flexível, sem deixar de permitir a determinação da estimati-va da variância da média para o inventário florestal.

A amostragem por conglomerados apresenta uma impor-tante vantagem que é a sensível redução dos custos, visto que custa mais efetuar a medição de unidades amostrais distribuí-das esparsamente na floresta que medir o equivalente quando as unidades estão reunidas em subpopulações.

Por outro lado, nos inventários nos trópicos, quando as subparcelas do conglomerado são definidas sistematicamente e dimensionadas de tal forma que um conglomerado seja medido em um dia de trabalho, o custo de medição de campo será sen-sivelmente reduzido. Entretanto, o cálculo do erro de amostra-gem sofre uma pequena tendência, pois, apesar dos conglome-rados serem selecionados inteiramente ao acaso, tem-se que as subparcelas são tomadas sistematicamente.

A tendência no cálculo da variância da média pode ser considerada desprezível no caso de inventários florestais, pois, normalmente, os valores das variáveis respostas são ordenados aleatoriamente por algum critério objetivo ou mesmo se suce-dem numa ordem natural, podendo-se, assim, através da análi-

234


se de variância, ter uma aproximação satisfatória da estimativa da variância da população.

A amostragem por conglomerados, no que se refere à apli-cação em levantamentos florestais, apresenta as seguintes van-tagens:

a) oferece melhor controle no trabalho de campo, pois as unidades de registro – subparcelas do conglomerado - são me-nores;

b) percepção de maior quantidade de variabilidade da va-riável resposta em questão, pois o conglomerado é formado por uma série de subparcelas, as quais explicam a variabilidade dentro do conglomerado;

c) em florestas tropicais, onde a acessibilidade é difícil, é vantajosa a aplicação da amostragem por conglomerados, prin-cipalmente quando apresenta uma forma estrutural para ser completamente mensurada no expediente de um dia de trabalho.

Freese (1962) cita que em inventários realizados em áre-as de difícil acesso, onde o custo de localização da unidade de amostra é alto, o uso da amostragem por conglomerados em dois estágios possibilita a redução do custo do levantamento, pois em cada conglomerado amostrado são medidas várias subparcelas.

Loetsch e Haller (1964) citam que, em razão da concentra-ção das subparcelas na amostra por conglomerado apresentar uma diminuição das distâncias a serem percorridas em relação à amostra aleatória, haverá uma substancial vantagem opera-cional e financeira.

A amostragem por conglomerados é classificada, de acor-do com a tomada das subparcelas, em:

a) amostragem por conglomerados em estágio único: quan-do são levantadas todas as subparcelas;

235


b) amostragem por conglomerados em dois estágios: quan-do ocorre subamostragem para seleção das subparcelas;

c) amostragem por conglomerados em três estágios: quan-do ocorre subamostragem de conglomerados e também suba-mostragem de subparcelas. A amostragem por conglomerados pode evoluir para mais estágios.

9.1 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO

A amostragem por conglomerados em estágio único é de-finida quando em cada unidade primária selecionada são medi-das todas as M subparcelas. As subparcelas também podem ser denominadas como unidades secundárias ou subunidades.

9.1.1 parâmetros populacionais e estimadores

Para formulação dos parâmetros populacionais e seus es-timadores, será considerado que a área total da população é dividida em N unidades primárias ou conglomerados, das quais serão selecionadas n primárias. Será considerado que cada uni-dade primária contém o mesmo número M de subparcelas.

a) valor médio por conglomerado e por subparcela

A notação que será usada é uma extensão natural daquela que já vem sendo utilizada. O índice inferior i indica o conglo-merado e o j a subparcela dentro do conglomerado.

ijy = valor da variável resposta correspondente à j-ésima subparcela correspondente ao i-ésimo conglomerado;

.iy = valor total das subparcelas para o i-ésimo conglome-rado;

236


Y = valor médio populacional considerando os conglome-rados;

iY = valor médio populacional por subparcela para o i-ési-mo conglomerado;

Y = valor médio populacional considerando todas as subparcelas;

iy = valor médio estimado por subparcela para o i-ésimo conglomerado;

y = valor médio estimado considerando todas as subparcelas;Y = valor total populacional; Y = valor total estimado.

Daí:

;1

.

N

y

Y

N

i

i��

� ;1

.

M

Y

NM

y

Y

N

i

i

��

�� ;

1

.

n

y

y

n

i

i��

�M

y

nM

y

y

n

i

i

��

��1

.

b) valor total Y e seu estimador Y

;YNMYNY �� yNMyNY ��ˆ

c) variância populacional e seus estimadores

)(1 yV = variância populacional para os valores totais dos conglomerados;

)(yV = variância populacional considerando os valores das subparcelas;

MyVyVb )()( 1= é variância dos conglomerados com base nas subparcelas;

)(yVw = variância média das subparcelas dentro dos con-glomerados;

237


)(yV = variância populacional da média dos conglomerados;)(yV = variância populacional da média das subparcelas;)(1 yV = variância estimada dos conglomerados; )(ˆ yV = variância estimada das subparcelas;

MyVyVb )(ˆ)(ˆ1= é a variância estimada dos conglomera-

dos com base nas subparcelas ou unidades secundárias;)(ˆ yVw = variância média estimada considerando as subpar-

celas dentro dos conglomerados;)(ˆ yV = variância estimada da média dos conglomerados;)(ˆ yV = variância estimada da média das subparcelas.

A Tabela 9.1 apresenta a análise de variância com base nas subparcelas, admitindo que os conglomerados foram sele-cionados através de uma amostra simples ao acaso:

238


tabela 9.1 - Análise de variância com base nas subparcelas.

CAUSAS DE VARIAÇÃO GL QM

Entre Conglomerados

Dentro dos Conglomerados

N-1

N(M-1)

)(yVQM bEntre �)( yVQM wDe ntro �

)(yVQM bEntre �)( yVQM wDe ntro �

T O T A L NM-11.

)()1()()1(

�

��

MN

yVMNyVNQM wb

Total

Sendo:

1

)(ˆ)1()(ˆ)1()(ˆ

�

��

�

nM

yVMnyVnyV wb (9.1)

A estimativa da variância a partir das subparcelas, Expres-são 9.1, tem uma pequena tendência porque as subparcelas não fazem parte de uma amostra simples ao acaso dentro das unidades primárias ou conglomerados. As subparcelas são sele-cionadas em grupos contíguos. Essa tendência é praticamente desprezível se o número de conglomerados for maior que 50.

A Expressão 9.1 pode ser escrita na forma simplificada 9.2.

M

yVMyVyV wb )(ˆ)1()(ˆ)(ˆ −+

= (9.2)

A partir da teoria da análise de variância, tem-se:

n

yMV

N

nN

n

yV

N

nNyV b )(

)()(

)()( 1 �

�

�

�

Tal que:

n

yVM

N

nN

n

yV

N

nNyV b )(ˆ

)()(ˆ

)()(ˆ 1 −=

−=

239


Portanto:

)(1

)()(2

yVMM

yVyV ==

Então:

)(ˆ1)(ˆ)(ˆ

2yV

MM

yVyV ==

Expandindo-se para o total da população, resulta:

)(ˆ)(ˆ)ˆ(ˆ 2 yVNyNVYV ==

A variância do valor médio por subparcela )(yV também pode ser expressa em função do coeficiente de correlação intra-conglomerado (d). Este coeficiente mede o grau de dependência entre as subparcelas dentro do conglomerado, sendo definido pela fórmula de Pearson:

2)(

))((

yyE

yyyyE

ij

ikij

�

��

Desenvolvendo-se, resulta:

)()1)(1(

))((2

)(

))(( 1

2yVNMM

YyYy

yyE

yyyyE

N

i

ik

M

kj

ij

ij

ikij

��

��

��

��

��

� (9.3)

Conforme Cochran (1977), a Expressão 9.3 pode ser escri-ta na forma 9.4:

)()1)(1(

)()1()1(

yVMNM

yVNMQMMN Entre

��

�� (9.4)

240


Que sob a condição )1()1( �� NMMN , tem-se:

)()1(

)(

yVM

yVQM Entre

�

��

Quanto maior o coeficiente de correlação intraconglome-

rado mais homogêneas são as subparcelas dentro dos conglo-merados e menos eficiente é a aplicação da amostragem por conglomerados.

Seja uma amostra inteiramente ao acaso de n de conglo-merados de uma população de tamanho N, cada um dos quais possuindo M subparcelas. O valor médio amostral por subpar-cela ( y ) é uma estimativa sem tendência de Y e sua variância é dada pela expressão:

)]1(1[)1(

)()1()

1()(

2��

�

��

�� M

NM

yVNM

n

fyV � (9.5)

Sendo:

1

)(

)(1

2

1

�

�

�

��

NM

Yy

yV

N

i

M

j

ij

Tomando-se NM-1 = NM e N-1 = N, a Expressão 9.5 pode ser simplificada para:

Destarte:

)]1(ˆ1)[(ˆ)1

()(ˆ ��

� MyVnM

fyV �

)]1(1)[()1

()( ��

� MyVnM

fyV �

241


9.2 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO COM UNIDADES DE GRANDEzAS DESIGUAIS

Seja uma amostra por conglomerado em estágio único, para o caso mais geral, onde cada conglomerado seja constituí-do por Mi unidades secundárias.


O valor médio populacional por subparcelas é dado, por:

0

1

1

1.

M

yM

M

yY

N

iii

N

ii

N

ii ∑

∑

∑=

=

= ==

Dado que:

∑=

=N

iiMM

10

Para estimar o valor médio por subparcela (Y ) existem três procedimentos:

1) Ignorando a variação de tamanho entre os conglo-merados


b) variância da média estimada

n

yy

n

ii∑

== 11

0

1

1

1

.

M

yM

M

y

Y

N

i

ii

N

i

i

N

i

i �

�

��

�

� ��

242


c) valor total estimado e sua variância

O valor total estimado é 101 yMY = e sua variância será

igual a )(ˆ)ˆ(ˆ1

201 yVMYV = .

Este procedimento gera uma estimativa tendenciosa e de pequena precisão, principalmente quando os valores de Mi va-riam muito e as médias dos conglomerados

iy apresentam pe-quena variação.

2) proceder a uma estimativa por razão, onde os Mi consti-tuem a variável auxiliar

a) valor médio por razão estimado por subparcela

n

nn

ii

n

ii

R M

y

M

yy ==

∑

∑

=

=

1

1.

Tendo-se:

;1

.

n

yy

n

ii

n

∑==

.1

n

MM

n

ii

n

∑==

b) variância da média estimada por razão por subparcela

Da teoria da estimativa por razão, tem-se:

212

1

12

1

1 ))(

(])(

[)()(N

n

iii

n

Ii

n

iii

n

ii

n

iii

RMn

YyM

E

M

YyM

EY

M

yM

EyV∑

∑

∑

∑

∑=

=

=

=

=

−≅

−=−=

243


Então:

)1

2)(

)((1

)(ˆ 1

22

1

2

1

2

2�

��

�

��

n

MyyMyyM

nN

nN

MyV

n

i

iR

n

i

iiR

n

i

ii

N

R

Tal que:

∑=

=N

iiN M

NM

1

1

c) valor total estimado por razão e sua variância

O valor total estimado é RR yMY 0ˆ = , então sua variância

será igual a )(ˆ)ˆ(ˆ 20 RR yVMYV = .

3) obter as estimativas se conhecidos os tamanhos dos conglomerados da população


0

1.

3 Mf

yy

n

ii

×=∑

=

Sendo:

;1

0 ∑=

=N

iiMM

N

nf =


n

yV

N

nN

MyV

N

)(ˆ)(

1)(ˆ 1

23

−= , tal que:

1

)(

)(ˆ

2

1.

1

2.

1 −

−=

∑∑ =

=

nn

yy

yV

n

iin

ii

244


c) valor total estimado e sua variância

O valor total estimado é ,ˆ303 yMY = então sua variância

será igual a ).(ˆ)ˆ(ˆ3

203 yVMYV = ).

Dentre os procedimentos apresentados, destaca-se que o segundo procedimento, estimativa por razão, é o melhor sob o ponto de vista teórico.

exercício 9.1

Seja uma floresta de 1.000 ha dividida em 100 áreas de observações fenológicas de dez hectares (unidades primárias ou conglomerados). Cada uma subdividida em cinco unidades secundárias ou subparcelas de dois hectares. Considerar uma amostra de dez conglomerados (C) e efetuar a análise estatísti-ca. A Tabela 9.2 apresenta a produção de sementes por subpar-cela (kg / 2 ha) para uma determinada espécie (dados fictícios).

tabela 9.2 - Produção de sementes por subparcela (dados fictícios) kg/2 ha.

C S1 S2 S3 S4 S5 Totais ( .iy ) )(ˆ yVwi

1 11,0 12,7 12,0 11,1 10,7 57,5 0,6852 9,6 10,5 8,0 9,8 8,0 45,9 1,2723 14,1 11,6 12,6 13,2 12,5 64,0 0,8554 15,4 12,8 14,1 13,0 14,0 69,3 1,0785 10,0 11,0 10,9 12,6 12,1 56,6 1,0676 13,0 14,0 12,9 13,9 12,8 66,6 0,3377 12,1 10,8 12,0 12,6 12,9 60,4 0,6478 13,5 14,4 15,1 16,0 15,9 74,9 1,1079 12,3 14,0 13,2 12,3 11,5 63,3 0,923

10 14,4 15,5 17,0 15,3 15,0 78,2 1,163Total 636,7 9,134

Tem-se que: ;7,636

1

.��

�

n

i

iy ;97,330.41

1

2

.��

�

n

i

iy 73,83021 1

2

��

�

n

i

M

j

ijy

245


a) valor médio estimado por subparcela

hakgnM

y

y

n

i

M

j

ij

2/734,12510

7,6361 1�

��

��


Dado que:

2

2

2

1

.

1

2

.

1 )10/(031222,889

10

7,63697,330.41

1

)(

)(ˆ hakgn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

2

2

1 1

1 1

2

2

)2/(979432653,349

50

7,63673,8302

1

)(

)(ˆ hakgnM

nM

y

y

yV

n

i

M

i

n

i

M

j

ij

ij

�

�

��

�

�

��

� �

� �

2

11

2

.

1

2

)2/(9134,010

134,9)(ˆ1

1

1)(ˆ hakgyV

nM

M

yy

nyV

n

i

wi

n

i

iM

j

ij

w ��

�

� ��

��

�

Então:21 )10/(9227,7

10

032222,88)

100

10100(

)(ˆ)()(ˆ hakg

n

yV

N

nNyV �

�

�

�

�

Ou, pela fórmula:2)10/(9227,7

10

606,175)

100

10100(

)(ˆ)()(ˆ hakg

n

yVM

N

nNyV b

�

��

�

�

�

Por conseguinte:

246


Outra maneira de obter a variância do valor médio por subparcela ou subunidade )(ˆ yV é em função do coeficiente de correlação intraconglomerado. A estimativa do coeficiente de correlação intraconglomerado ( d ) entre as subparcelas de um mesmo conglomerado é dada pela fórmula:

Seja, Tabela 9.3, a análise de variância dos dados:

tabela 9.3 - Análise de variância.

CV GL SQ QM

Entre 9 158,4562 17,6062444

Dentro 40 36,536 0,9134

Total 49 194,9922 3,979432653

Então:

Logo:

)(ˆ)1)(1(

)(ˆ)1()ˆ()1(ˆ

yVMnM

yVnMMQMn Entre

��

��

247


c) intervalo de confiança do valor médio populacional por subparcela (Y )


d) intervalo de confiança para o valor total populacional (Y)


e) limite de erro da estimativa do valor médio por subparcela

hakgnM

y

y

n

i

M

j

ij

2/734,12510

7,6361 1�

��

��

562949,00211,2734,12)(: �� ystyIC

hakgYhaIC 2/8718,132/5962,11: ��

hakgYhakgIC /935889,6/7981,5: ��

22222 99975,228.79316915999,05100)2/(ˆ)ˆ(ˆ kghayVMNYV ��

kgYs 4764639,281)ˆ( �

4764639,2810211,26367)ˆ(ˆ: �� YstYIC

kgYkgIC 89,935.611,798.5: ��

kghayMNY 367.6734,1251002/ˆ ��

%97,81002/734,12

2/564942466,00211,2100

)(% ��

�

��

�

�

ha

ha

y

ystLE

248


exercício 9.2

Seja uma área florestal de 1.000 ha dividida em N = 80 áreas de observações fenológicas com grandezas desiguais (unidades primárias ou conglomerados). Cada uma subdividida em unida-des secundárias ou subparcelas de um hectare. Considerar uma amostra de dez conglomerados (C) e efetuar a análise estatística. A Tabela 9.4 apresenta a produção de sementes por conglomera-do (kg/ha) para uma determinada espécie (dados fictícios).

tabela 9.4 - Produção de sementes (kg/ha).

C iM Totais ( .iy ) iy

1 17 479,4 28,2

2 11 256,3 23,3

3 10 328,0 32,8

4 14 464,8 33,2

5 15 495,0 33,0

6 13 413,4 31,8

7 10 308,0 30,8

8 13 372,6 28,7

9 9 294,3 32,7

10 8 311,2 38,9

Total 120 3723,0 313,4

1) Ignorando a variação de tamanho entre os conglo-merados

Sabe-se que:

249




c) valor total estimado

d) variância estimada do valor total

e) intervalo de confiança do valor médio populacional por subparcela (Y )

Pode-se afirmar, com uma probabilidade de acerto de

95%, que o valor médio populacional encontra-se no intervalo de 28,9784 kg/ ha a 33,7016 kg/ ha.

hakgn

y

y

n

i

i

/34,3110

4,3131

1 ��

��

9

10

4,31328,971.9

)1080

1080(

1

)(

)()(ˆ

2

2

1

1

2

1

�

�

��

�

��

�

��

�

�

n

n

y

y

Nn

nNyV

n

i

in

i

i

2

1)/(451761111,1)(ˆ hakgyV �

hakgys /204890,1)( 1 �

kgyMY 0,3134034,311000ˆ101

��

222

011111,1451761451761111,11000)(ˆ)ˆ(ˆ kgyVMYV

R��

kgYs 1505,775.3)ˆ(1

�

204890,196,134,31)(: 11 �� ystyIC

hakgYhakgIC /7016,33/9784,28: ��

250


f) intervalo de confiança do valor total populacional (Y )


95%, que o valor total populacional encontra-se no intervalo de 23.940,7050 kg a 38.739,2950 kg.

g) limite de erro da estimativa do valor médio por subparcela

Este procedimento gera uma estimativa tendenciosa e de pequena precisão, principalmente quando os valores de Mi va-riam muito e as médias dos conglomerados iy apresentam pe-quena variação.

2) proceder a estimativa por razão, onde os iM consti-tuem a variável auxiliar

a) valor médio estimado por razão

b) variância do valor médio por razão estimado

1505,377596,10,340.31)ˆ(ˆ: 11 �� YstYIC

kgYkgIC 2950,739.387050,940.23: ��

%54,710034,31

204890,196,1100

)(%

1

1��

��

��

y

ystLE

hakg

M

y

yn

i

i

n

i

i

R/025,31

120

0,3723

1

1

.

��

�

�

�

�

)1

2)(

)((1

)(ˆ 1

22

1

2

1

2

2 �

��

�

��

n

MyyMyyM

nN

nN

MyV

n

i

iR

n

i

iiR

n

i

ii

N

R

)9

1514025,310,624.46025,3122,587.452.1)(

8010

1080(

5,12

1)(ˆ

2

2

��

�

��

RyV

2)/(049667,1)(ˆ hakgyV R �

hakgys R /024533,1)( �

251


Tendo:

c) valor total estimado por razão

d) variância estimada do valor total por razão

Destarte:

e) intervalo de confiança do valor médio populacional por subparcela (Y )


)1

2)(

)((1

)(ˆ 1

22

1

2

1

2

2 �

��

�

��

n

MyyMyyM

nN

nN

MyV

n

i

iR

n

i

iiR

n

i

ii

N

R

)9

1514025,310,624.46025,3122,587.452.1)(

8010

1080(

5,12

1)(ˆ

2

2

��

�

��

RyV

2)/(049667,1)(ˆ hakgyV R �

hakgys R /024533,1)( �

5,1280

10001

1

��

N

i

iNM

NM

kgYR 0,025.31025,311000ˆ��

220,667.049.1049667,11000)ˆ(ˆ kgYV R ��

kgYs R 532576,1024)ˆ( �

024533,196,1025,31)(: �� RR ystyIC

hakgYhakgIC /033085,33/016915,29: ��

252


f) intervalo de confiança do valor total populacional (Y )


95%, que o valor total populacional encontra-se no intervalo de 29.016,915 kg a 33.033,085 kg.

g) limite de erro da estimativa do valor médio por razão

3) obter as estimativas se conhecidos os tamanhos dos conglomerados da população


Dado que 125,080

10 ��N

nf , então:

b) variância estimada do valor médio

Dado que:

532576,102496,10,025.31)ˆ(ˆ: �� RR YstYIC

kgYkgIC 085,033.33915,016.29: ��

%47,6100025,31

024533,196,1100

)(% ��

�

��

�

�

R

R

y

ystLE

hakgMf

y

y

n

i

i

/784,291000125,0

0,3723

.0

1

.

3�

��

��

2

2

2

1

.

1

2

.

1)/(044444,7349

9

10

0,37233,214.452.1

1

)(

)(ˆ hakgn

n

y

y

yV

n

i

in

i

i

�

�

��

�

�

��

�

�

253


Então:

c) valor total estimado

d) variância estimada do valor total

e) intervalo de confiança para o valor médio por subparcela (Y )


f) intervalo de confiança para o valor total (Y )

10

0444444,7349)

80

1080(

5,12

1)(ˆ)(

1)(ˆ

2

1

23

�

�

�

�

n

yV

N

nN

MyV

N

2

3)/(115464889,4)(ˆ hakgyV �

hakgys /028660861,2)( 3 �

kgyMY 0,784.29784,291000ˆ303

��

22

3

2

03 889,464.115.4115464889,41000)(ˆ)ˆ(ˆ kgyVMYV ��

kgYs 660861,028.2)ˆ( 3 �

028661,296,1784,29)(: 33 �� ystyIC

hakgYhakgIC /760176,33/807824,25: ��

660861,202896,10,29784)ˆ(ˆ: 33 �� YstYIC

kgYkgIC 17529,760.3382471,807.25: ��

254



g) limite de erro da estimativa do valor médio por unidade secundária

Dentre os procedimentos apresentados, destaca-se que o segundo, estimativa por razão, é o melhor sob o ponto de vista teórico da estatística.

9.3 AMOSTRAGEM POR CONGLOMERADOS EM ESTáGIO úNICO PELAS PROPORçõES

Seja um inventário florestal composto por n conglomerados estruturados com m subparcelas, as quais podem ser classi-ficadas em duas categorias: C1 e C0. Admitindo que qualquer subparcela do conglomerado pertença a uma das duas catego-rias, C1 e C0, onde C1 corresponde às subparcelas que possuem o atributo desejado e C0 definem os dados que não o possuem.

Seja a seguinte notação:ia = número de subparcelas pertencente à categoria C1 no

conglomerado de ordem i ;N = número total de conglomerados da população;n = número de conglomerados amostrado;M = número de subparcelas por conglomerado;

Map ii /= é proporção de subparcelas pertencentes à cate-goria C1 no conglomerado de ordem .i

%35,13100784,29

028661,296,1100

)(%

3

3��

�

��

�

�

y

ystLE

255


9.3.1 valores populacionais e estimadores

a) proporção estimada

Para quantificar os resultados, seja a seguinte regra para qualquer subparcela yij da amostra ou da população:

yij = 1, se yij estiver contido em C1;yij = 0, se yij estiver contido em C0.

Para a amostra de valores yij , resulta que:

∑=

=M

jiij ay

1

yij = ai

Daí, para o conglomerado de ordem i, tem-se:

M

a

M

yp ii

i ==

ip : é a proporção de subparcelas do conglomerado i per-tencente à categoria C1.

b) variância da proporção

Considerando uma amostra aleatória de n conglomerados, define-se como valor de p, a média das observações pi obtidas na amostra, tal que p é uma estimativa da proporção P popula-cional. Então:

Dado que Map ii /= , logo: ��

�

��

n

i

n

i

i

inM

a

pn

p1

11 . Então:

n

yV

N

nNpV

)()()(

−= , para

1

)(

1

)()( 1

2

12

1

2

−

−=

−

−=

∑∑

∑=

=

=

NN

pp

N

PpyV

N

I

N

Ii

i

N

ii

256


∑=

=N

iip

NP

1

1

Resultando:

n

yV

N

nNpV

)(ˆ)()(ˆ −

= , para .1

)(

1

)()(ˆ 1

2

12

1

2

−

−=

−

−=

∑∑

∑=

=

=

nn

pp

n

ppyV

n

I

n

Ii

i

n

ii

No caso de ocorrer variação no tamanho do conglomerado, então p é uma estimativa por razão, ou seja:

iii Map /= , logo:

∑

∑

∑

∑

=

=

=

= ==n

Ii

n

iii

n

ii

n

ii

M

pM

M

ap

1

1

1

1

Por conseguinte, a estimativa da variância é dada pela ex-pressão:

1

2

)(1

)(ˆ 1 1 1

222

2 �

��

�

� � ��

n

MpMapa

nN

nN

MpV

n

i

n

i

n

i

iiii

N

Sendo:

N

MM

n

ii

N

∑== 1

exercício 9.3

Seja um inventário florestal com 40 conglomerados selecio-nados em uma área de 7.200 ha. O objetivo é conhecer a ocorrên-cia de cipós. A estrutura conglomerada usada é constituída por oito subparcelas de 1 ha. Os dados estão apresentados na Tabela 9.5.

Sabe-se que:

257


área = 7.200 ha.área do conglomerado ou unidade primária = 8 ha.Número de conglomerados amostrados ( n =40).Número de total de conglomerados ( 9008/200.7 ==N ).Número de subparcelas por conglomerados ( 8=M ).

tabela 9.5 - Número de subparcelas (ai) por conglomerado (C) com ocor-rência de cipós.

C ai pi = ai /8 C ai pi = ai /8 C ai pi = ai /8 C ai pi = ai /8

1 0 0,000 11 0 0,000 21 1 0,125 31 0 0,000

2 3 0,375 12 1 0,125 22 2 0,250 32 1 0,125

3 1 0,125 13 5 0,625 23 1 0,125 33 2 0,250

4 3 0,375 14 3 0,375 24 2 0,250 34 0 0,000

5 2 0,250 15 2 0,250 25 4 0,500 35 0 0,000

6 1 0,125 16 1 0,125 26 2 0,250 36 4 0,500

7 2 0,250 17 3 0,375 27 3 0,375 37 1 0,125

8 4 0,500 18 0 0,000 28 2 0,250 38 1 0,125

9 1 0,125 19 3 0,375 29 4 0,500 39 0 0,000

10 0 0,000 20 0 0,000 30 0 0,000 40 2 0,250


Sendo:

;3750,81

��

n

i

ip 0,671

��

�n

i

ia

Então:

209375,040

3750,81 ��

��

n

p

p

n

i

i

Ou,

209375,0840

0,671 ��

��

��

nM

a

p

n

i

i

258


b) variância da proporção estimada

Dado que:

030759,039

40

3750,89531,2

1

)(

)(ˆ

2

1

2

12

�

�

��

�

�

��

�

�

n

n

p

p

yV

n

I

n

I

i

i

Então:

0007535955,040

030759,0

2000

402000)(ˆ)()(ˆ ��

��

��

n

yV

N

nNpV

027452,0)(ˆ)( �� pVps

c) intervalo de confiança para a proporção 027452,00211,2209375,0 ��IC

264858,0153892,0 �� P

Pode-se afirmar, com uma probabilidade de acerto de 95%, que a porcentagem populacional de ocorrência de cipós encon-tra-se no intervalo de 15,39% a 26,49%.

d) ocorrência e intervalo de confiança para o total de subparcelas

d1) total estimado de subparcelas com ocorrência de cipós209375,09008ˆ

�� MNpA = 1507,5 subparcelas

d2) intervalo de confiança para o total de subparcelas com ocorrência de cipós

)264858,0153892,0(200.7 �� AIC

ssubparcelaAssubparcelaIC 9776,906.10224,108.1 ��

259


Pode-se afirmar, com uma probabilidade de acerto de 95%, que o total populacional de subparcelas com ocorrência de ci-pós encontra-se no intervalo de 1.108,024 a 1.906,9776.

exercício 9.4

Seja uma população constituída de 200 comunidades (CO) e localizada em uma área florestal com vocação para produção de castanha do brasil, tal que foram selecionadas 30 delas. Em cada comunidade foi determinado o número (ai) de famílias que traba-lham na coleta. Estimar a proporção e o número médio de famílias por comunidade envolvidas nessa atividade. O número total de fa-mílias na população é 4.200. Considerar cada comunidade como um conglomerado. Os dados estão apresentados na Tabela 9.6. Neste exercício, é importante observar que há variação no tamanho do conglomerado, então será uma estimativa por razão para p.

tabela 9.6 - Número de famílias, por comunidade, envolvidas na coleta )( ia .

CO Mi

ai pi CO Mi ai pi CO Mi ai pi

1 24 11 0,474190 11 20 11 0,526656 21 18 9 0,5029412 20 9 0,438285 12 30 15 0,498580 22 20 11 0,5287463 18 9 0,482603 13 22 10 0,468295 23 22 10 0,4493584 21 10 0,458886 14 20 10 0,520994 24 21 11 0,5077735 20 10 0,494757 15 21 11 0,509420 25 22 10 0,4431846 16 8 0,509868 16 23 12 0,500911 26 22 10 0,4832887 21 10 0,465188 17 29 16 0,538024 27 17 9 0,5191648 26 13 0,513292 18 14 7 0,486561 28 17 8 0,4831699 15 6 0,392642 19 18 8 0,440110 29 24 12 0,486588

10 19 10 0,508764 20 25 13 0,512418 30 15 7 0,500293

Tem-se que:Número total de famílias entrevistadas �

�

30

1i

iM = 620

260


Número total de famílias que fazem coleta


b) variância da proporção estimada

Dado que ;3262

30

1

2��

�i

ia ;13236

30

1

2

��

�i

iM ��

�30

1

6555i

iiMa , tem-se:

c) intervalo de confiança para a proporção

Pode-se afirmar, com uma probabilidade de acerto de 95%, que a porcentagem populacional de famílias envolvidas na cole-ta de castanha está no intervalo de 48,15% a 50,56%.

��

30

1i

ia = 306

493548,0620

30630

1

30

1��

�

�

�

�

i

i

i

i

M

a

p

1

21

)(ˆ 1 1 1

222

�

��

�

� � ��

n

MpMapa

nN

nN

MpV

n

i

n

i

n

i

iiii

N

29

13236493548,06555493548,023262

20030

30200

21

1)(ˆ

2

2

��

�

��pV

0,21200

4200

3 0

1 ��

�

N

M

M i

i

N

71430000348667,0)(ˆ �pV

780059048091,0)( �ps

780059048091,00452,2493548,0 ��IC

505624515,0481471484,0 �� P

261


d) número médio estimado de famílias por comunidade en-volvidas na coleta de castanha

e) variância estimada do número médio de famílias por co-munidade envolvidas na coleta de castanha

f) intervalo de confiança para o número médio de famílias por comunidade envolvidas na coleta de castanha

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o número médio populacional de famílias por comunidade envolvidas na coleta de castanha está no intervalo de 10,1109 famílias a 10,6181 famílias.

9.4 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ES-TáGIOS

Para o melhor entendimento das fórmulas de variâncias utilizadas na amostragem por conglomerados, é necessário ob-ter os componentes de variância considerando o modelo mate-mático utilizado.

364508,10493548,021 �� pMyNR

1240,00452,2364508,10 ��IC

6181,101109,10 �� Y

015376246,071430000348667,021)(ˆ)(ˆ 22�� pVMyV

NR

1240,0)( �Rys

262


9.4.1 componentes de variâncias no modelo inteiramente ao acaso

Existem vários métodos para obter estimativas de compo-nentes de variâncias, sendo o mais usado é o método dos mo-mentos ou da análise de variância. Barbin (1993) cita a existên-cia dos seguintes métodos:

a) métodos da Máxima Verossimilhança, onde os métodos de Herderson I, II e III são de análise de variância para dados não balanceados;

b) método da Máxima Verossimilhança Restrita;

c) método de RAO denominado de MINQUE (Minimum Norm Quadratic Unbiased Estimative);

d) método de RAO denominado de MIVQUE (Minimum Va-

riance Quadratic Unbiased Estimative);

e) os métodos de Bayes.

Considerando a disposição dos dados conforme a Tabela 9.7 e a análise de variância para a população com base nas subparcelas de acordo com a Tabela 9.8, para obter os com-ponentes de variâncias para a amostragem por conglomerados em dois estágios, modelo inteiramente ao acaso, usar-se-á o método dos momentos ou da análise de variância para calcular os componentes de variâncias que consiste em obter a espe-rança matemática dos quadrados médios (QM) da análise de variância, onde as estimativas dos QM são igualadas às suas respectivas esperanças matemáticas.

263


tabela 9.7 - Dados populacionais.

Subparcelas Conglomerados1 2 .... N

1

2...

M

y11 y21 ••• yN1

y12 y22 ••• yN2 ••• ••• ••• •••

y1M y2M ••• yNM

Totais y1 • y2• ••• yN•

tabela 9.8 - Análise de variância para população com base nas subparcelas.

Causas de variação G.L. SQ QM

Conglomerados

Resíduo

N-1

N(M-1)

)1/( �NSQCong

)]1(/[ �MNSQDentro

)1/( �NSQCong


Total NM-1 )1/( �NMSQTotal

)1/( �NMSQTotal

Considerando os conglomerados aleatórios, então os com-ponentes de variância são obtidos segundo o modelo matemáti-co do delineamento inteiramente ao acaso, portanto:

Y = média geral, sendo E(Y ) =Y e E( 2Y ) = 2Y

ci = efeito de conglomerados ( Ni ,,1 L= ) considerado alea-tório, normal e independentemente distribuído com média zero e variância Ve(y), ou seja, ci~N [0,Ve(y)], para E(ci ) = 0 e E( 2

ic ) = Ve(y). =)(yVe componente de variância entre os conglomerados.

ije = erro suposto aleatório com Mj ,,1 L= , normal e inde-

ijiij ecYy ��

264


pendentemente distribuído com média zero e variância Vd (y), ou seja, eij ~ N[(0 , )(yVd ], dado que E( ije )= 0 e E( 2

ije ) = Vd (y).

)(yVd é definido como o componente de variância entre as subparcelas dentro dos conglomerados.

Supondo que os efeitos aleatórios do modelo são não cor-relacionados, logo:

0),( �iji

ecCov , � i,j

0),( ' �ii ccCov para 'ii �

0),( '' �jiij eeCov para 'ii � e 'jj �

Sejam as expressões das Somas de Quadrados (SQ) do modelo para obter as esperanças matemáticas dos quadrados médios.

��

��N

i

M

j

ijT otal CySQ1 1

2, onde

NM

y

C

N

i

M

j

ij��

�1

2

1

)(

��

��

N

iiCong Cy

MSQ

1

2.

1

� ��

��N

i

N

i

i

M

j

ijCongTotals yM

ySQSQSQ1 1

2

.

1

2

Re

1

� ��

��N

i

N

i

M

j

iji

M

j

ij ecYEyE1 1

2

11

2 )()(

� ��

��N

i

N

i

M

jijiijiiji

M

jij eceYcYecYEyE

1 1 1

222

1

2)222()(

)()(])()([)( 2

1 1 1

2

1

2 yNMVyNMVYNMyVyVYyEde

N

i

N

i

M

j

de

M

j

ij��

� � ��

(9.6)

��

��

� �

� ��

N

i

M

j

iji

N

i

M

j

ij

ecYENMNM

y

ECE1 1

21

2

1)]([

1)

)(

()(

])()([1

)(1 1

2

1

22222 dpecMYMNENM

CEN

i

M

j

ij

N

i

i ��

265


dp = duplos produtos

(9.7)

Dado que:

Das Expressões 9.6 e 9.7, têm-se:

Então:

��

��N

i

M

j

ijT otal CySQ1 1

2, onde

NM

y

C

N

i

M

j

ij��

�1

2

1

)(

��

��

N

iiCong Cy

MSQ

1

2.

1

� ��

��N

i

N

i

i

M

j

ijCongTotals yM

ySQSQSQ1 1

2

.

1

2

Re

1

� ��

��N

i

N

i

M

j

iji

M

j

ij ecYEyE1 1

2

11

2 )()(

� ��

��N

i

N

i

M

jijiijiiji

M

jij eceYcYecYEyE

1 1 1

222

1

2)222()(

)()(])()([)( 2

1 1 1

2

1

2 yNMVyNMVYNMyVyVYyEde

N

i

N

i

M

j

de

M

j

ij��

� � ��

(9.6)

��

��

� �

� ��

N

i

M

j

iji

N

i

M

j

ij

ecYENMNM

y

ECE1 1

21

2

1)]([

1)

)(

()(

])()([1

)(1 1

2

1

22222 dpecMYMNENM

CEN

i

M

j

ij

N

i

i ��

)()()]()([1

)( 22222 yVyMVYNMyNMVyVNMYMNNM

CEdede

��

)()()( 2

21

1

2 yNVcccEcE eN

N

i

i ��

�

)()()( 2

1211

1 1

2 yNMVeeeEeE dNM

N

i

M

j

ij ��

�

)]()([)()()(22 yVyMVYNMyNMVyNMVYNMSQE dedeTotal ��

)1)(())(()( �� NMyVMNMyVSQE deTotal

1

)1)(())(()(

�

��

NM

NMyVMNMyVQME de

Total

� �

� �

� �

� ��

N

i

N

i

ii

N

i

M

j

ij

yEM

yEMM

y

E1 1

2

.

2

.

2

1 1)(

1)(

1]

)(

[

.

1

i

M

j

ij yy ��

� ��

��

N

i

M

j

iji

N

i

i eMcYMEM

yEM 1 1

2

1

2

. )(1

)(1

� ��

��N

i

M

j

iji

N

i

i dpecMYMEM

yEM 1 1

22222

1

2

. ])([(1

)(1

��

��N

i

de

N

i

iyMVyVMYM

MyE

M 1

222

1

2

.]0)()([

1)(

1

)()()(1 2

1

2

.yNVyNMVNMyE

Mde

N

i

i��

�

� (9.8)

266


(9.8)

Das Expressões 9.8 e 9.7, têm-se:

Sendo:

Na Tabela 9.9, considerando o delineamento inteiramen-te ao acaso, é apresentado o esquema de análise de variância com os componentes de variância.

1

)1)(())(()(

�

��

NM

NMyVMNMyVQME de

Total

� �

� �

� �

� ��

N

i

N

i

ii

N

i

M

j

ij

yEM

yEMM

y

E1 1

2

.

2

.

2

1 1)(

1)(

1]

)(

[

.

1

i

M

j

ij yy ��

� ��

��

N

i

M

j

iji

N

i

i eMcYMEM

yEM 1 1

2

1

2

. )(1

)(1

� ��

��N

i

M

j

iji

N

i

i dpecMYMEM

yEM 1 1

22222

1

2

. ])([(1

)(1

��

��N

i

de

N

i

iyMVyVMYM

MyE

M 1

222

1

2

.]0)()([

1)(

1

)()()(1 2

1

2

.yNVyNMVNMyE

Mde

N

i

i��

�

� (9.8)

)]()([)()()(22 yVyMVYNMyNVyNMVYNMSQE dedeCong ��

)()1()()1()()()()()( yVNyVNMyVyMVyNVyNMVSQEdededeCong

��

)]()1()()1([1

1)

1()( yVNyVNM

NN

SQEQME de

Cong

Cong ��

�

�

�

�

)()()( yVyMVQME deCong ��

)()()()( CongTotalCongT otalD entro SQESQESQSQESQE ��

)]()1()()1([)]()1()()1([)( yVNyVNMyVNMyVNMSQEdedeDentro

��

)()1()]()1()]()1()( yVMNyVNyVNMSQE dddDen tro ��

)()]()1([)1(

1]

)1([)( yVyVMN

MNMN

SQEQME

dd

Dentro

Dentro��

�

�

�

�

267


tabela 9.9 - Modelo inteiramente ao acaso com os componentes de vari-ância.

Causas de Variação G.L. SQ QM E(QM)

Entre cong.

Dentro cong.

N-1

N(M-1)

Total NM-1

Pode-se, então, obter os seguintes estimadores:


Neste processo, em cada unidade primária (conglomera-do) selecionada é medida uma subamostra de unidades secun-dárias ou subparcelas.

Será considerado, para formulação dos parâmetros popu-lacionais e seus estimadores, que os n conglomerados selecio-nados contêm o mesmo número m de subparcelas.

Seja a seguinte notação:ijy = valor da variável resposta da j-ésima subparcela cor-

respondente ao i-ésimo conglomerado;.iy = valor total das subparcelas do i-ésimo conglomerado;

Y = valor médio populacional dos conglomerados;Y = valor médio populacional das subparcelas;y = valor médio estimado dos conglomerados;y = valor médio estimado das subparcelas;Y = valor total populacional; Y = valor total estimado.

)1/( �NSQCong


)1/( �NMSQTotal

)1/( �NSQCong


)()( yMVyV ed �

)(yVd

1

)1)(())((

�

��

NM

NMyVMNMyV de

Dentrod MQyV ˆ)(ˆ� e

m

MQMQyV

DentroCon g

e

ˆˆ)(ˆ

�

�

268


a) valor médio por conglomerado e por subparcela

b) valor total Y e seu estimador Y

c) variâncias populacionais e seus estimadores

Dado que:)(1 yV = variância populacional entre os valores médios dos

conglomerados;)(2 yV = média das variâncias populacionais das subparce-

las dentro dos conglomerados;)(1 yV = variância estimada entre os valores médios dos

conglomerados;)(ˆ

2 yV = média das variâncias estimadas das subparcelas dentro dos conglomerados;

)(yV = variância populacional da média dos conglomerados;)(yV = variância populacional da média das subparcelas;)(ˆ yV = variância estimada da média dos conglomerados;)(ˆ yV = variância estimada da média das subparcelas.

Então:

1

)(

1

)(

)(

2

1

11

2

1�

�

��

�

�

��

�

��

N

N

Y

Y

N

YY

yV

N

i

iN

i

i

N

i

i

��

�N

i

iyV

NyV

1

22 )(1

)( , sendo:

1

)(

1

)(

)(

2

1

1

2

1

2

2�

�

��

�

�

��

�

��

M

M

y

y

M

Yy

yV

M

j

ijM

j

ij

M

j

iij

i

;1

.

N

y

Y

N

i

i�� ;

1

.

M

Y

NM

y

Y

N

i

i

��

�� ;1

.

n

y

y

n

i

i��

m

y

nm

y

y

n

i

i

��

��1

.

;YNMYNY �� yNMyNY ��ˆ

269


Resultando os estimadores:

Se os n conglomerados e as m subparcelas forem sele-cionados por amostragem simples ao acaso, conclui-se, como demonstrado em Vries (1986), que y é uma estimativa sem ten-dência de Y e sua variância é:

Sendo as frações amostrais do primeiro e do segundo es-tágios:

N

nf �1

eM

mf �2

, pode-se usar a Fórmula 9.9.

mn

yVf

n

yVfyV

)()1(

)()1()( 2

21

1 ��


N

nf �1

eM

mf �2


mn

yVf

n

yVfyV

)()1(

)()1()( 2

21

1 �� (9.9)

1

)(

1

)(

)(

2

1

11

2

1�

�

��

�

�

��

�

��

N

N

Y

Y

N

YY

yV

N

i

iN

i

i

N

i

i

��

�N

i

iyV

NyV

1

22 )(1

)( , sendo:

1

)(

1

)(

)(

2

1

1

2

1

2

2�

�

��

�

�

��

�

��

M

M

y

y

M

Yy

yV

M

j

ijM

j

ij

M

j

iij

i

1

)(

)(ˆ

2

1

1

2

1�

�

�

��

�

�

n

n

y

y

yV

n

i

in

i

i

��

�n

i

i yVn

yV1

22 )(ˆ1)(ˆ , tal que:

1

)(

1

)(

)(ˆ

2

1

1

2

1

2

2�

�

��

�

�

��

�

��

m

m

y

y

m

y

yV

m

j

ijm

j

ij

m

j

ij

i

yi

mn

yV

M

mM

n

yV

N

nNyV

)()(

)()()(

21 �

�

�

�

270


Sendo sua estimativa sem tendência dada pela Fórmula 9.10.

(9.10)

Sendo:

1

)()(ˆ 1

2

1 −

−=∑

=

n

yyyV

n

ii

; )1(

)(

)(ˆ 1

2

12 −

−=∑∑

= =

mn

yy

yV

n

ii

m

jij

A Fórmula 9.10 pode ser escrita na forma 9.11 em função dos componentes de variância.

(9.11)

Verificação:Seja:

Então:

Logo:

Dado que:

mn

yVff

n

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

21

1

1��

NM

yV

N

yV

nm

yV

n

yVyV dede

)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ

��

mn

yVff

n

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

21

1

1��

mn

yV

M

m

N

n

n

yV

N

nyV

)(ˆ)1(

)(ˆ)1()(ˆ 21

��

NM

yV

Nm

yV

N

yV

n

yVyV

)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ 2211

��

m

yVyV

m

yVmyV

m

MQ

n

yy

yV d

e

edEntre

n

i

i)(ˆ

)(ˆ)(ˆ)(ˆˆ

1

)(

)(ˆ 1

1��

��

�

�

�

��

)(ˆ)(ˆ2

yVyV d�

2

271


Portanto:

Resultando:

Expandindo-se para o total da população, tem-se:

d) intensidade de amostragem para população finita

e) intensidade de amostragem para população finita em função dos componentes de variância

NM

yV

Nm

yV

N

m

yVyV

n

m

yVyV

yV dd

d

e

d

e )(ˆ)(ˆ)(ˆ

)(ˆ)(ˆ)(ˆ

)(ˆ ��

�

�

�

�

NM

yV

Nm

yV

Nm

yV

N

yV

nm

yV

n

yVyV dddede

)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ)(ˆ ��

NM

yV

N

yV

nm

yV

n

yVyV dede )(ˆ)(ˆ)(ˆ)(ˆ

)(ˆ��

)(ˆ)(ˆ)ˆ(ˆ 22yVMNyNMVYV ��

])(ˆ)(ˆ)(ˆ)(ˆ

[)(ˆ 2211222

NM

yV

Nm

yV

N

yV

n

yVtyVtE ��

])(ˆ)(ˆ)(ˆ

[)(ˆ

2212122

NM

yV

Nm

yV

N

yVt

n

yVtE ��

])(ˆ)(ˆ

)(ˆ[

)(ˆ

22

1

2

2

1

2

M

yV

m

yVyV

N

tE

yVtn

��

�

])(ˆ)(ˆ)(ˆ)(ˆ

[)(ˆ 222

NM

yV

N

yV

nm

yV

n

yVtyVtE dede

��

])(ˆ

)(ˆ[])(ˆ

)(ˆ[22

2

M

yVyV

N

t

m

yVyV

n

tE d

e

d

e ��

])(ˆ

)(ˆ[

])(ˆ

)(ˆ[

22

2

M

yVyV

N

tE

m

yVyVt

nd

e

d

e

��

�

�

272


f) número ótimo de subparcelas para população finita A fórmula para obter o número ideal de subparcelas é obti-

da minimizando a função custo dada pela expressão C = nc1 + nmc2 que é muito usada em inventários florestais.

C = c1n + c2nm

C = custo total de medição de campo;c1 = custo médio de deslocamento entre conglomerados;c2 = custo médio de medição das subparcelas.

Então:

)( 2121 mccnnmcncC ��

Para:

]

)(ˆ)(ˆ[

])(ˆ

)(ˆ[

22

2

M

yVyV

N

tE

m

yVyVt

nd

e

de

++

+=

Por conseguinte:

])(ˆ

)(ˆ[

)]()(ˆ

)(ˆ[

2

2

21

2

M

yVyV

N

tE

mccm

yVyVt

Cd

e

d

e

��

��

�

)](ˆ)(ˆ)(ˆ)(ˆ[

])(ˆ

)(ˆ[

22

1

12

2

2

yVcyVmcm

yVccyV

M

yVyV

N

tE

tC

de

d

e

d

e

��

��

�

])(ˆ)(ˆ)(ˆ)(ˆ

[)(ˆ 222

NM

yV

N

yV

nm

yV

n

yVtyVtE dede

��

])(ˆ

)(ˆ[])(ˆ

)(ˆ[22

2

M

yVyV

N

t

m

yVyV

n

tE d

e

d

e ��

])(ˆ

)(ˆ[

])(ˆ

)(ˆ[

22

2

M

yVyV

N

tE

m

yVyVt

nd

e

d

e

��

�

�

273


Tomando-se a primeira derivada em relação a m e anulan-do, tem-se:

Logo:

)(ˆ)(ˆ

2

1

yVc

yVcm

e

dOti =

De acordo com Péllico Netto e Brena (1997), os estima-dores das variâncias podem ser obtidos segundo o critério da análise de variância para o modelo aleatório. Não obstante, considerando 1)1( �� nmnm e atendendo à condição de que a amostra por conglomerados, geralmente, é aplicada às popu-lações extensas, o estimador da variância entre as subunidades considerando todos os conglomerados é: )(ˆ)(ˆ)(ˆ yVyVyV de += , onde: )(ˆ yVe

é o componente de variância entre conglomerados e )(ˆ yVd é o componente de variância entre subparcelas dentro dos conglomerados.

Cochran (1977), Vries (1986) e Sanquetta et al. (2009) expõem teoricamente os estimadores da amostragem em con-glomerados como sendo uma estrutura monolítica, ou seja, os

)](ˆ)(ˆ[

])(ˆ

)(ˆ[

22

1

2

2

2

yVcm

yVc

M

yVyV

N

tE

t

dm

Ce

d

d

e

��

��

�

0�

dm

C

0)](ˆ)(ˆ[ 22

1�� yVc

m

yVce

Oti

d

)(ˆ

)(ˆ

2

12

yVc

yVcm

e

d

Oti �

274


conglomerados são previamente definidos e os parâmetros são conceitualmente apresentados para a modelagem matemática usando a análise de variância, daí ter-se a fórmula para o coefi-ciente de correlação intraconglomerados (d ), a partir dos com-ponentes de variância entre e dentro dos conglomerados.

Considerando os fatores de correção para o primeiro e se-gundo estágios desprezíveis, a expressão para o estimador da variância da média por subparcela, em função do coeficiente de correlação intraconglomerado, é:

O estimador d é definido como o coeficiente de correlação intraconglomerado, o qual explica o grau de dependência entre as subparcelas dentro dos conglomerados. Este coeficiente é importante para delinear a estrutura amostral do conglomerado. O valor )1(ˆ −md mede a eficiência da amostragem por conglome-rados em relação à amostra simples ao acaso.

Dado que:

)(ˆ)1)(1(

)(ˆ)1()ˆ()1(ˆ

yVmnm

yVnmMQmnEn tre

��

��

Sob a condição )1()1( �� nmmn , resulta:

)(ˆ)(ˆ)(ˆ

)(ˆ)(ˆ

ˆyVyV

yV

yV

yV

de

ee

+==d

Para obtenção da expressão:

)]1(ˆ1[)(ˆ

)(ˆ �� mnm

yVyV �

Pode-se adotar o seguinte procedimento:

)]1(ˆ1[)(ˆ

)(ˆ �� mnm

yVyV �

275


Seja a equação:

Esta fórmula pode ser escrita da seguinte forma:

Destarte:

O valor ])()([ 21 MyVyV − é o componente de variância entre

os valores médios dos conglomerados Ve(y), assim como )(2 yV é o componente de variância entre os valores médios das subpar-celas dentro dos conglomerados Vd(y). Considerando que o valor N seja grande, tal que NyV )(1 seja desprezível, tem-se:

Consequentemente:

Dado que )()( yVyVe d= e )()()( yVyVyV de += , então:

)]()([(1

)(1

)( yVyVnm

yVn

yV ��

)]1(1

[)(

)( dd −+=mn

yVyV

)1

()(

)(m

m

n

yVyV

dd −+=

mn

yV

M

mM

n

yV

N

nNyV

)()(

)()()( 21

�

�

�

�

Mn

yV

mn

yV

N

yV

n

yVyV

)()()()()( 2211

��

)(1

)(1

])(

)([1

)( 12

2

1 yVN

yVnmM

yVyV

nyV ��

)(1

])(

)([1

)( 2

2

1 yVnmM

yVyV

nyV ��

)(1

)(1

)( yVnm

yVn

yVde

��

276


Finalmente:

Destarte:

É importante verificar que:

Se 1f é desprezível, a fórmula mn

yVff

n

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

21

1

1��

será simplificada para:

n

yVyV

)(ˆ)(ˆ 1=

Como m

yVyVyV d

e

)(ˆ)(ˆ)(1 += , então:

Dado que:

)(ˆ)(ˆ

)(ˆ)(ˆ)(ˆ

ˆyV

yV

yVyV

yV e

de

e =+

=d , pois )(ˆ)(ˆ)(ˆ yVyVyV de +=

Então:

)]1(1[)(

)( �� mnm

yVyV �

)]1(ˆ1[)(ˆ

)(ˆ �� mnm

yVyV �

n

yV

nm

yV

n

yVyV de )()()()( 1

��

nm

yV

n

yV

m

yVyV

nyV ded

e

)(ˆ)(ˆ)

)(ˆ)(ˆ(

1)(ˆ ��

nm

yVyV

n

yVyV

)(ˆˆ)(ˆ)(ˆˆ)(ˆ ��

��

nm

yVyVyVmyV

)(ˆˆ)(ˆ)(ˆˆ)(ˆ ��

�

277


Logo:

Finalmente:

Para efeitos práticos em inventários florestais, Péllico Netto e Brena (1997) recomendam que o limite aceitável do valor do coefi-ciente de correlação intraconglomerado seja de 4,0≤d , pois, para

4,0>d a população estará mais apropriada para estratificação. g) intensidade de amostragem para populações infinitas A fórmula para obter o número de conglomerado (n) é ob-

tida fixando-se a semiamplitude do intervalo de confiança (E). O valor E é definido como uma porcentagem da média. A por-centagem estabelecida é denominada de Limite de Erro (LE) ou margem de erro, originando a expressão E = LE yLEE ×= .

Dado que E = LE yLEE ×= , então E = LE )(ystyLEE ×=×= e )(ˆ22 yVtE = , logo:

Resultando:

)]1(ˆ1[)(ˆ

2

2

−+= mmE

yVtn d

h) número ótimo de subparcelas para populações infinitas

)ˆ1ˆ()(ˆ)(ˆˆ)(ˆ)(ˆˆ

)(ˆ ��

��

� mnm

yV

nm

yVyVyVmyV

)]1(ˆ1[()(ˆ

)(ˆ �� mmnm

yVyV �

)]1(ˆ1[)(ˆ

)(ˆ2

22�� m

nm

yVtyVtE �

)]1(ˆ1[)(ˆ

)(ˆ2

22�� m

nm

yVtyVtE �

278


A fórmula para obter o número ideal de subparcelas é obtida minimizando a função custo dada pela expressão C = nc1 + nmc2

C = custo total de medição no campo;c1 = custo médio de deslocamento entre conglomerados;c2 = custo médio de medição das subparcelas.

Como C = nc1 + nmc2 e )]1(ˆ1[)(ˆ

2

2

−+= mmE

yVtn d , então:

Tomando-se a primeira derivada, tem-se:

Dada a condição 0�dm

dC , então:

0)ˆ1ˆ1(

)(ˆ122122

2

=++− cm

ccmE

yVt

OtiOti

dd , logo:

0)ˆ1ˆ1( 12212

=++− cm

ccm OtiOti

dd

⇒=++− 0ˆ)ˆ1( 221 c

m

c

Oti

dd 0ˆ)ˆ1( 22

1 =++− cmc Otidd

Então:)ˆ1(ˆ

122 dd −= ccmOti

22

2

12

2

)]1(ˆ1[)(ˆ

)]1(ˆ1[)(ˆ

mcmmE

yVtcm

mE

yVtC ��

))](1(ˆ1[)(ˆ

212

2

mccmmE

yVtC ��

22

2

12

2

22

2

12

2

22

2

12

2 ˆ)(ˆˆ)(ˆˆ)(ˆˆ)(ˆ)(ˆ)(ˆc

E

yVtc

mE

yVtmc

E

yVtc

E

yVtc

E

yVtc

mE

yVtC

��

)ˆˆ

ˆˆ1(

)(ˆ

2121212

2

ccm

mccccmE

yVtC �

��

)ˆ1ˆ1(

)(ˆ122122

2

cm

ccmE

yVt

dm

dC��

279


Finalmente:

)ˆ

ˆ1(

2

1

dd−

=c

cmOti

Esta fórmula também pode ser escrita da seguinte forma:

)(ˆ)(ˆ

2

1

yV

yV

c

cm

e

dOti =

Verificação:Dado que:

)(ˆ)(ˆ

)(ˆ)(ˆ)(ˆ

ˆyV

yV

yVyV

yV e

de

e =+

=d

Então:

]

)(ˆ)(ˆ)(ˆ

)(ˆ)(ˆ

[]

)(ˆ)(ˆ

)(ˆ)(ˆ

1

[2

1

2

1

yV

yV

yV

yVyV

c

c

yV

yV

yV

yV

c

cm

e

e

e

e

Oti

−

=

−

=

)(ˆ)(ˆ

2

1

yV

yV

c

cm

e

dOti = (9.12)

Tomando-se a segunda derivada para verificar a natureza do ponto crítico, tem-se:

)ˆ1()(ˆ2

)ˆ22(

)(ˆ

32

21

13132

2

2��

mE

yVtcc

mc

mE

yVt

dm

dC

Dado que )()](ˆ2[ 3221 mEyVtc )] / (E2m2) é um termo sempre positivo,

280


logo Otim obtido pela Fórmula 9.12 torna mínimo o custo do in-ventário quando 1ˆ ≠d , pois dC / dm2 > 0.

É importante sublinhar que a expressão para obter o nú-mero ótimo de subparcelas do conglomerado é a mesma tanto para população finita como para infinita.

9.4.3 ocorrência de estimativa negativa do componente de variância entre conglomerados )(ˆ yVe

O valor )1(ˆ −md mede a eficiência da amostragem por con-glomerados em relação à amostra simples ao acaso. Quando

0ˆ >d a amostra simples ao acaso (ASA) é mais precisa que a amostra por conglomerados. Se 0ˆ <d a ASA é menos precisa que a amostra por conglomerados. Quando 0ˆ =d a precisão é a mesma entre a ASA e a amostra por conglomerados.

A fórmula do coeficiente de correlação intraconglomerado dada por )](ˆ)(ˆ[)(ˆˆ yVyVyV dee +=d )], sendo mMQMQyV DentroEntree )ˆˆ()(ˆ −= e

Dentrod MQyV ˆ)(ˆ = , denota que se 0ˆ <d implica que 0)(ˆ <yVe , ou seja, o componente de variância estimado entre os conglome-rados é negativo. Neste caso, tem-se que: DentroEntre MQMQ ˆˆ < e, consequentemente, .1ˆˆ <= DentroEntre MQMQF

Searle (1971) recomenda considerar os seguintes procedi-mentos quando 0)(ˆ <yVe

:

a) considerar a estimativa como negativa admitindo que o parâmetro )(yVe seja nulo. Este procedimento pode trazer pro-blema na aplicação de determinadas fórmulas.

No caso da expressão:

)]1(ˆ1[)(ˆ

2

2

−+= mmE

yVtn d )]

281


Não haverá dificuldade de operar matematicamente.

Por outro lado, para obter )ˆ

ˆ1(

2

1

dd−

=c

cm , deverá ocorrer

.0ˆ >d

b) admitir o valor do parâmetro 0)( =yVe e considerar a es-timativa negativa como nula. Neste caso é recomendável testar a hipótese 0)(:0 =yVH e , aplicando o teste F bilateral;

c) considerar o valor do parâmetro como zero e retirá-lo do modelo de análise de variância;

d) o uso de modelo matemático inadequado pode resultar na presença de estimativas de componentes de variância negativas;

e) o método utilizado para obter as estimativas de compo-nentes de variância pode não ser adequado. Neste caso usar outros procedimentos;

f) a presença de estimativas de componentes de variância negativas pode estar relacionada ao problema do tamanho da amostra. Neste caso é importante medir mais conglomerados.

exercício 9.5

Seja o exemplo, apresentado em Queiroz (1998), de um inventário florestal com amostragem em dois estágios de uma área com 49.000 ha, onde foram mensurados 20 conglomera-dos. A estrutura espacial do conglomerado apresentou a forma cruz de malta, composta por quatro subparcelas retangulares de 10 m de largura por 250 m de comprimento. A distância de cada subunidade ao ponto central foi de 100 m. Os dados da variável

282


resposta volume total de madeira considerando todas as espé-cies com DAP 45 cm estão apresentados na Tabela 9.10. A resolução deste exemplo será realizada de três formas:

1) Analisar a partir das subparcelas considerando a popu-lação infinita.

2) Analisar por meio das subparcelas considerando a po-pulação finita.

3) Análise considerando o conglomerado como unidade amostral, usando a metodologia da amostra simples ao acaso.

4) Comparar os resultados dos referidos procedimentos de análise.

tabela 9.10 - Conglomerado (C) em dois estágios (m3/ 0,25 ha).

C S1 S2 S3 S4 Total Média Variância1 43,75 42,50 32,75 57,10 176,10 44,0250 100,16082 62,75 47,25 34,50 66,01 210,51 52,6275 213,02673 77,65 73,50 69,25 39,50 259,90 64,9750 300,19424 57,20 67,50 37,50 38,02 200,22 50,0550 219,28285 51,10 43,50 58,25 58,25 211,10 52,7750 49,59426 68,00 75,50 37,28 64,33 245,11 61,2775 277,55647 45,76 34,80 57,30 63,17 201,03 50,2575 158,49718 60,10 78,70 58,33 37,27 234,40 58,6000 287,10069 63,75 79,90 75,13 42,23 261,01 65,2525 281,469110 49,88 55,17 35,37 44,24 184,66 46,1650 71,709611 88,17 67,30 65,28 37,13 257,88 64,4700 439,276912 27,18 34,89 64,30 58,17 184,54 46,1350 320,183513 37,80 48,24 49,15 58,89 194,08 48,5200 74,310214 55,71 58,29 43,16 37,12 194,28 48,5700 101,942915 45,11 43,12 55,83 54,17 198,23 49,5575 40,613716 35,35 63,23 70,90 85,14 254,62 63,6550 438,483017 48,15 38,90 61,37 55,33 203,75 50,9375 93,600918 38,75 45,17 40,44 39,89 164,25 41,0625 7,993819 49,10 55,13 63,17 37,14 204,54 51,1350 120,267520 50,10 52,70 37,37 57,13 197,30 49,3250 71,9438

Total 1055,36 1105,29 1046,63 1030,23 4237,51 3667,2077

283


1) Analisar a partir das subparcelas considerando a po-pulação infinita

a) valor médio estimado por conglomerado

b) valor médio estimado por subparcela

c) análise de variância e obtenção dos componentes de variância

tabela 9.11- Conglomerado em dois estágios: análise de variância.

CAUSAS DE VARIAÇÃO GL SQ QM

Entre conglomeradosDentro dos conglomerados

1960

4.178,157511.001,6220

219,9030183,3604

TOTAL 79 15.179,7790 192,1491

d) coeficiente de correlação intraconglomerado estimado

hamn

y

y

n

i

i

/8755,21120

51,4237 31

.

��

��

ha ;mm

y

nm

y

y

n

i

i

25,0/9689,524

8755,211 31

.

��

� y �� m / ha3

23)25,0/(1357,9

4

3604,1839030,219ˆˆ)(ˆ ham

m

MQMQyV DentroEntre

e ��

��

�

23)25,0/(3604,183ˆ)(ˆ hamMQyV Dentrod ��

23)25,0/(4961,192)(ˆ)(ˆ)(ˆ hamyVyVyV de ��

047459143,03604,1831357,9

1357,9

)(ˆ)(ˆ

)(ˆˆ �

��

��

yVyV

yV

de

e�

284


e) variância da média população infinita

Usando a fórmula:

Verifica-se que este resultado é o mesmo obtido pela fórmula:

O resultado idêntico confirma tratar-se de fórmulas seme-lhantes.

f) intervalo de confiança para o valor médio

A metodologia para a obtenção do intervalo de confiança é a mesma para os procedimentos expostos, com exceção para o número de graus de liberdade da estatística “t” de Student que no caso da aplicação da amostragem simples ao acaso será n -1. O número de graus de liberdade na amostra por conglomerados, quando analisada por meio das subparcelas, é n(m – 1).

Limite inferior para o valor médio

)]14(047459143,01[420

4961,192)]1(1[

)(ˆ)(ˆ ��

�� m

nm

yVyV �

23)25,0/(74878,2)]1(1[

)(ˆ)(ˆ hamm

nm

yVyV ��

232 )/(98048,4374878,24)(ˆ hamyV ��

)/(631778,6)( 3 hamys �

)25,0/(748788,220

975763,54)(ˆ)(ˆ 31 ham

n

yVyV ��

)]1(1[)(ˆ

)(ˆ �� mnm

yVyV �

)(025.0;60 ysty �� = 211,8755 - 2,0003 � 6,631778 = 198,61 m3/ ha

631778,698048,43)(ˆ)( �� yVys

285


Limite superior para o valor médio )(025.0;60 ysty �� = 211,8755 + 2,0003 � 6,631778 = 225,14 m3/ ha

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor médio populacional encontra-se no intervalo de 198,61 m3/ ha a 225,14 m3/ ha.

g) intervalo de confiança para o valor total

Limite inferior para o valor total Área[ )(025,0;60 ysty �� ] = 49.000 � 198,60922 = 9.731.887,77 m3

Limite superior para o valor totalÁrea )]([ 025,0;6 0 ysty �� = 49.000 � 225,141046 = 11.031.911,23 m3

Pode-se afirmar, com uma probabilidade de acerto de 95%, que o valor total populacional encontra-se no intervalo de 9.731.887,77 m3 a 11.031.911,23 m3.

h) limite de erro ou margem de erro (LE) do inventário flo-

restal Seja E a semiamplitude de intervalo de confiança e LE o

limite de erro:

)(ystE ×= E = 2,0003 )(ystE ×= 6,631778 = 13,265546 m3/ ha

%26,61008755,211

265546,13100% ��

y

ELE

286


Pode-se afirmar que o limite de erro ou margem de erro, com uma probabilidade de acerto de 95%, para os valores da média e total populacional encontrados nos intervalos de con-fiança obtidos é de 6,26%.

i) dimensionamento da amostra por conglomerados

Suponha que o limite de erro estipulado seja de 5% (LE=0,05). O resultado da análise mostrou que para 20 conglo-merados o limite de erro foi de 6,26%. Então, deve-se calcular o número de conglomerados para atender o limite de erro (LE) igual a 0,05 e calcular, posteriormente, o número de conglome-rados faltantes.

Dado que E = LE x y = 0,05 x 211,8755 = 10, 593775, tem-se:

36,31]30475,01[4593775,10

9368,30790003,2)]1(ˆ1[

)(ˆ

2

2

2

2

��

�� m

mE

yVtn �

n = 32 conglomerados

Considerando que são necessários 32 conglomerados para atender ao limite de erro escolhido de 5%, deve-se retornar à floresta e medir mais 12 conglomerados, visto que já foram medidos 20 conglomerados.

j) número de subparcelas ideal )

0475,0

0475,01(3)

ˆ

ˆ1(

2

1 −=

−=

dd

c

cmOti

= 7,76

=Otim 8 subunidades

O resultado demonstra que o ideal seria estruturar um con-glomerado com oito subparcelas, o que diminuiria o número de

287


conglomerados a medir, entretanto, deve-se ressaltar que os da-dos usados no exemplo são simulados. Neste exemplo utilizou-se 3/ 21 =cc , considerando as experiências existentes em inven-tários florestais nos trópicos.

2) Analisar por meio das subparcelas considerando a população finita

a) variância da média de população finita

Dado que:

231

2

1 )25,0/(9758,541

)(

)(ˆ hamn

yy

yV

n

i

i

��

�

�

��

231

2

1

2)25,0/(3604,183

)1(

)(

)(ˆ hammn

yy

yV

n

i

i

m

j

ij

��

�

�

� ��

Sabe-se que:

;19625,0

49 ��ha

haM ;000.1

49

000.49 ��ha

haN ;02,0

000.1

201

��N

nf

0204,0196

42

��M

mf

Então:

mn

yVff

n

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

21

1

1��

204

3604,183)0204,01(02,0

20

975763,54)02,01()(ˆ

�

��yV

23)25,0/(7387,2)(ˆ hamyV �

)25,0/(6549,17387,2)(ˆ)(3

hamyVys ��

232)/(8195,43738717,24)(ˆ hamyV ��

288


b) limite de erro considerando a população finita

c) intensidade de amostragem de população finita

Usando a fórmula expressa em função dos componentes de variância:

Os demais cálculos são obtidos como mostrado no item anterior (intervalo de confiança, dimensionamento, etc.)

mn

yVff

n

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

21

1

1��

204

3604,183)0204,01(02,0

20

975763,54)02,01()(ˆ

�

��yV

23)25,0/(7387,2)(ˆ hamyV �

)25,0/(6549,17387,2)(ˆ)(3

hamyVys ��

232)/(8195,43738717,24)(ˆ hamyV ��

%25,610097,52

6549,10003,2100

)(��

�

��

�

�

y

ystLE

])(ˆ)(ˆ

)(ˆ[

)(ˆ

22

1

2

2

1

2

M

yV

m

yVyV

N

tE

yVtn

��

�

)196

3604,183

4

3604,1839758,54(

1000

0003,2)97,5205,0(

9758,540003,22

2

2

��

��n

17985518,31054849185,7

9691759,219��n

])(ˆ

)(ˆ[

])(ˆ

)(ˆ[

22

2

M

yVyV

N

tE

m

yVyVt

n

de

d

e

��

�

�

17985518,31

]196

)3604,1831357,9[

1000

0003,2)97,5205,0(

]4

3604,1831357,9[0003,2

2

2

2

�

��

�

�n

289


3) considerando o conglomerado como unidade de ob-servação. obter a média e a variância da média a partir da aplicação da metodologia da amostra simples ao acaso

a) valor médio estimado por conglomerado

.iy = valor total das subparcelas do i-ésimo conglomerado

b) variância da média por conglomerado

4) comparação dos resultados considerando a variân-cia da média para os três procedimentos de análise:

tabela 9.12 - Variância da média por conglomerados em dois estágios.

Estimadores Variância da média (m3/ ha)2

Vries (1986) e Cochran (1977): População Finita 43,8195Péllico Netto e Brena (1997): População Infinita 43,9805Metodologia: Amostra simples ao acaso 43,1010

Os resultados da Tabela 9.12 mostram que as estimativas

da variância da média foram praticamente idênticas, demons-trando, neste exemplo, que os resultados independem da me-todologia usada. No entanto, ressalta-se que se trata de uma

hamn

y

y

n

i

i

/8755,21120

51,4237 31

.

��

��

23

2

1

.

1

2.

. )/(612205,8791

)(

)(ˆ hamn

n

y

y

yV

n

i

in

i

i

i ��

�

�

��

�

23. )/(1010,4320

612205,879)

000.1

20000.1(

)(ˆ)()(ˆ ham

n

yV

N

nNyV i �

��

��

290


população infinita com um coeficiente de correlação intraconglo-merado (0,047459143) próximo de zero.

exercício 9.6

Este exemplo objetiva mostrar a aplicação das fórmulas para obtenção do coeficiente de correlação intraglomerado, as-sim como algumas maneiras de obter os componentes de vari-ância, visando facilitar a interpretação desses parâmetros. A Ta-bela 9.13 apresenta os dados. Obter o coeficiente de correlação intraconglomerado usando as seguintes expressões:

a)

b)

c)

d)

e)

291


tabela 9.13 - Dados considerando cinco conglomerados (C).

C S1 S2 S3 S4 Total Médias VariânciasC1C2C3C4C5

43,7562,7577,6557,2051,10

42,5047,2573,5067,5043,50

32,7534,5069,2537,5058,25

57,1066,0139,5038,0258,25

176,10210,51259,90200,22211,10

44,02552,627564,97550,05552,775

100,160833213,026692300,194167219,282767 49,594167

tabela 9.14 - Cálculos: coeficiente de correlação intraconglomerado.

NPC yij y yik (yij – y )(yik – y )1 43,75 52,8915 42,50 94,993897252 43,75 52,8915 32,75 184,123522253 43,75 52,8915 57,10 -38,472002754 42,50 52,8915 32,75 209,300397255 42,50 52,8915 57,10 -43,732627756 32,75 52,8915 57,10 -84,765502757 62,75 52,8915 47,25 -55,616727758 62,75 52,8915 34,50 -181,312602759 62,75 52,8915 66,01 129,32873225

10 47,25 52,8915 34,50 103,7556472511 47,25 52,8915 66,01 -74,0080177512 34,50 52,8915 66,01 -241,2688927513 77,65 52,8915 73,50 510,2355472514 77,65 52,8915 69,25 405,0119222515 77,65 52,8915 39,50 -331,5534527516 73,50 52,8915 69,25 337,1241472517 73,50 52,8915 39,50 -275,9787277518 69,25 52,8915 39,50 -219,0648527519 57,20 52,8915 67,50 62,9407222520 57,20 52,8915 37,50 -66,3142777521 57,20 52,8915 38,02 -64,0738577522 67,50 52,8915 37,50 -224,8467277523 67,50 52,8915 38,02 -217,2503077524 37,50 52,8915 38,02 228,8946922525 51,10 52,8915 43,50 16,8248722526 51,10 52,8915 58,25 -9,5997527527 51,10 52,8915 58,25 -9,5997527528 43,50 52,8915 58,25 -50,3243527529 43,50 52,8915 58,25 -50,3243527530 58,250 52,8915 58,25 28,71352225

Total 73,14083250

292



Então:

a)

b)

tabela 9.15 - Análise de variância para conglomerados.

C.Variação GL SQ QM

Entre cong 4 931,01918 232,754795

Dentro cong 15 2646,775875 176,451725

Total 19 3.577,795055 188,3050029


01362866,03050029,188)14()145(

3050029,188)145(754795,2324)15(ˆ =×−×−×

×−×−××−=d

c) )(ˆ)1(

)(ˆˆˆ

yVm

yVMQ Entre

−

−=d


754795,232ˆ =EntreMQ

451725,176ˆ =DentroMQ

3050029,188ˆ)(ˆ == TotalMQyV

14083250,73))((1

��

n

i

ik

m

kj

ij yyyy

01362866,03050029,188)145)(14(

14083250,732

)(ˆ)1)(1(

))((2

ˆ 1�

��

��

��

��

�

��

yVnmm

yyyyn

i

ik

m

kj

ij

�

b))(ˆ)1)(1(

)(ˆ)1(ˆ)1(ˆ

yVmnm

yVnmMQmn Entre

��

��

01362866,03050029,188)145)(14(

14083250,732

)(ˆ)1)(1(

))((2

ˆ 1�

��

��

��

��

�

��

yVnmm

yyyyn

i

ik

m

kj

ij

�

b))(ˆ)1)(1(

)(ˆ)1(ˆ)1(ˆ

yVmnm

yVnmMQmn Entre

��

��

293


Então:

078684034,03050029,188)14(

3050029,188754795,232

)(ˆ)1(

)(ˆˆˆ =

×−−

=−

−=

yVm

yVMQ Entred

d) )(ˆ)(ˆ

)(ˆˆ

yVyV

yV

de

e

+=d


É importante mencionar que ao empregar no quesi-to c a expressão ])(ˆ)1[()](ˆˆ[ˆ yVmyVMQ

Entre��

utilizou-

se o valor TotalMQyV ˆ)(ˆ = , pois se fosse usada a fórmula )(ˆ)(ˆ)(ˆ yVyVyV de += o resultado seria o mesmo da expressão

usada no quesito d. As expressões dos quesitos a e b apresentaram os mes-

mos resultados, pois são semelhantes. As expressões dos que-sitos c e d apresentaram valores aproximadamente cinco vezes maiores que os resultados das expressões dos itens a e b, de-monstrando que aquelas (c e d) só são recomendadas para inventários com áreas extensas e com grande intensidade de amostragem.

Para uma visão mais interpretativa dos componentes de variância )(ˆ yVe e )(ˆ yVd , seja o seguinte procedimento para ob-tê-los:

0757675,144

451725,176754795,232ˆˆ)(ˆ �

��

��

m

MQMQyV

DentroEntre

e

451725,176ˆ)(ˆ �� Dentrod MQyV

073877881,0451725,1760757675,14

0757675,14

)(ˆ)(ˆ

)(ˆˆ �

��

�

�

yVyV

yV

de

e�

294


)(ˆ yVd é a média das variâncias dentro dos conglomerados

Confirmação: 451725,176ˆ)(ˆ == Dentrod MQyV


4575,2645

1

=∑=i

iy

Então:

Seja a variância da média dentro do i-ésimo conglomerado:

m

yVyV i

i

)(ˆ)(ˆ =

Então:

]4

)(ˆ

4

)(ˆ

4

)(ˆ

4

)(ˆ

4

)(ˆ[

5

1)(ˆ1)(ˆ

54321

1

1 yVyVyVyVyV

m

yV

nn

yVn

i

i

n

ii

++++== ∑∑

=

=

30866,220.14

5

1

2��

�i

iy

295


Seja então:

Confirmando que:

Conclui-se que o componente de variância entre )(ˆ yVe é a diferença entre a variância da média das médias )(ˆ yV e a média das variâncias das médias dentro de cada conglomerado ).(ˆ

iyV ).

9.5 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ES-TáGIOS COM GRANDEzAS DESIGUAIS

Dada uma amostragem por conglomerados em dois está-gios, onde cada unidade primária seja constituída por Mi uni-dades secundárias ou subparcelas, tal que cada conglomerado possua mi subparcelas.



Seja iii myy .= o valor médio estimado por subparcela, onde .iy é o total considerando as mi subparcelas enumeradas no i-ésimo conglomerado.

Para estimar o valor médio populacional por subparcela Y existem, como no caso do conglomerado em estágio único, três

1129313,44)4

258626,882(

5

1)(ˆ

1 ��

��

n

yVn

i

i

075768,141129313,4418869968,58

)(ˆ

)(ˆ)(ˆ 1 ��

��

n

yV

yVyV

n

i

i

e

075768,144

451725,176754795,232ˆˆ)(ˆ

)(ˆ)(ˆ 1 ��

��

��

��

m

MQMQ

n

yV

yVyV DentroEntre

n

i

i

e

296


procedimentos que resultam nas seguintes estimativas das mé-dias:

a1) n

yy

n

ii∑

== 11

a2) ∑

∑

=

==n

ii

n

iii

R

M

yMy

1

1

a3) N

n

iii

Mn

yMy

∑== 1

3

b) variância da média por razão

Considerando que a estimativa é por razão ( Ry ), tem-se:

212

1

12

1

1 ))(

())(

()()(N

n

iii

n

Ii

n

iii

n

ii

n

iii

R Mn

YyME

M

YyMEY

M

yMEyV

∑

∑

∑

∑

∑=

=

=

=

=

−≅

−=−=

Sendo:

N

MM

N

ii

N

∑== 1

Da teoria da estimativa por razão, segundo Cochran (1977), considerando uma amostra por conglomerados em dois está-gios, tem-se que a estimativa da variância para Ry é:

297


Dado:

;1 N

nf = ;2

i

ii M

mf =

1

)(

)(ˆ

2

1

1

2

2 −

−=

∑∑ =

=

i

i

m

iijm

jij

i m

m

yy

yV

i

i

)(2 yV i é a variância das subparcelas dentro do i-ésimo conglomerado.

exercício 9.7

Seja um inventário florestal com 20 conglomerados (C) em dois estágios. A estrutura espacial do conglomerado apresenta uma forma cruz de malta, composta por subparcelas retangula-res de 10 m de largura por 250 m de comprimento. A distância de cada subparcela ao ponto central foi de 100 m. Considerar que algumas subparcelas não foram medidas e que também houve variação no tamanho da unidade primária (variação do grid/grandezas desiguais). Os dados para a variável resposta definida como o volume total de madeira considerando todas as espécies com DAP 45 cm estão apresentados na Tabela 9.16. A Tabela 9.17 mostra os cálculos auxiliares usados para obter as estimativas.

298


tabela 9.16 - Conglomerados em dois estágios ( m3/ 0,25 ha) com grandezas desiguais.

C Mi mi S1 S2 S3 S41234567891011121314151617181920

196200196200200210196196196230196210196196196196140196196180

43444444424424442443

43,7562,7577,6557,2051,1068,0045,7660,1063,7549,8888,1727,1837,8055,7145,1135,35*****38,7549,1050,10

42,50****73,5067,5043,5075,5034,8078,7079,9055,1767,3034,89*****58,2943,1263,23*****45,1755,1352,70

32,7534,5069,2537,5058,2537,2857,3058,3375,13*****65,2864,30****43,1655,8370,9061,3740,4463,1737,37

57,1066,0139,5038,0258,2564,3363,1737,2742,23*****37,1358,1758,8937,1254,1785,1455,3339,8937,14*****

1055,36 1105,29 1046,63 1030,23

299


tabela 9.17 - Cálculos auxiliares: conglomerados (C) em dois estágios com grandezas desiguais.

C Mi mi

1 196 4 176,10 44,0250 100,161 8628,9 1691264 0,0204082 200 3 163,26 54,4200 300,262 10884,0 2176800 0,0150003 196 4 259,90 64,9750 300,194 12735,1 2496080 0,0204084 200 4 200,22 50,0550 219,283 10011,0 2002200 0,0200005 200 4 211,10 52,7750 49,594 10555,0 2111000 0,0200006 210 4 245,11 61,2775 277,556 12868,3 2702338 0,0190487 196 4 201,03 50,2575 158,497 9850,5 1930692 0,0204088 196 4 234,40 58,6000 287,101 11485,6 2251178 0,0204089 196 4 261,01 65,2525 281,469 12789,5 2506740 0,020408

10 230 2 105,05 52,5250 13,992 12080,8 2778573 0,00869611 196 4 257,88 64,4700 439,277 12636,1 2476680 0,02040812 210 4 184,54 46,1350 320,184 9688,4 2034554 0,01904813 196 2 96,69 48,3450 222, 394 9475,6 1857222 0,01020414 196 4 194,28 48,5700 101,943 9519,7 1865865 0,02040815 196 4 198,23 49,5575 40,614 9713,3 1903801 0,02040816 196 4 254,62 63,6550 438,483 12476,4 2445370 0,02040817 140 2 116,70 58,3500 18,241 8169,0 1143660 0,01428618 196 4 164,25 41,0625 7,994 8048,3 1577457 0,02040819 196 4 204,54 51,1350 120,268 10022,5 1964402 0,02040820 180 3 140,17 46,7233 67,304 8410,2 1513835 0,016667

Total 3922 3869,08 210.048

De acordo com os resultados contidos na Tabela 9.17, tem-se:

.iy iy )(2 yV i ii yM ii yM 2iii Mmf =2

300



b) variância do valor médio estimado por razão

Utilizou-se nM devido ao desconhecimento de .NM A partir

da variância da média )(ˆRyV , os cálculos do intervalo de con-

fiança e do limite de erro seguem a metodologia já vista ante-riormente.

9.6 CONGLOMERADOS EM DOIS ESTáGIOS: ANáLISE ES-TATíSTICA CONSIDERANDO A OCORRêNCIA DE TIPOLO-GIAS DIFERENTES NA SUBPARCELA

Seja uma amostra por conglomerado em dois estágios, onde cada conglomerado é constituído por m subparcelas, nas quais foram registradas a ocorrência de uma determinada tipolo-gia. A ocorrência pode acontecer completamente na parcela ou em parte da mesma.

)25,0/(5563,53922.3

048.210 3

1

1 ham

M

yM

yn

i

i

n

i

ii

R ��

�

�

�

�

301



Para estimar o valor médio populacional por subparcela Y , o procedimento mais vantajoso é a estimativa por razão. A estimati-va por razão tem uma pequena tendência, mas torna-se despre-zível quando o número de conglomerados é grande )30( ≥n 30).


Seja Ai a área de ocorrência dentro do i-ésimo conglomera-do da tipologia de interesse. Pode-se escrever a estimativa por razão do volume médio por subparcela:

∑

∑

=

==n

ii

n

iii

R

A

yAy

1

1

iA = área do i-ésimo conglomerado correspondente à ocor-rência da variável resposta da tipologia considerada;

ijy = valor da variável resposta da tipologia de interesse correspondente a j-ésima subparcela do i-ésimo conglomerado;

m

yy i

i.= é o valor médio estimado do i-ésimo conglomerado;

.iy = valor total referente ao i-ésimo conglomerado.

b) variância estimada do valor médio por razão

Da teoria da estimativa por razão, considerando-se uma amostra por conglomerados em dois estágios, tem-se que a es-timativa da variância de Ry é:

302


212

1

12

1

1 ))(

())(

()()(N

n

iii

n

Ii

n

iii

n

ii

n

iii

RAn

YyAE

A

YyAEY

A

yAEyV

∑

∑

∑

∑

∑=

=

=

=

=

−≅

−=−=

Utilizou-se N

AA

N

ii

N

∑== 1 no lugar de .1

n

AA

n

ii

n

∑==

De acordo com Cochran (1977), desenvolvendo tem-se:

)(ˆ)1(

1

2)(

)(1

)(ˆ2

1

2

2

22

11

22

1

2

1

2

2yV

m

fA

An

f

n

AyyAyyA

nN

nN

AyV i

n

i i

ii

N

n

i

iR

n

i

iiR

n

i

ii

N

R ��

�

��

�

��

�

;1N

nf � ;2

i

i

iM

mf � ;1

i

m

i

ij

im

y

y

i

��

1

)(

)(ˆ

2

1

1

2

2�

�

�

��

�

�

i

i

m

i

ijm

j

ij

im

m

y

y

yV

i

i

)(ˆ2 yV i é a variância da ocorrência tipológica das subpar-

celas dentro do i-ésimo conglomerado.No caso de ocorrer:

22 ff i = ; :21 nmmm === L

Então:

)(ˆ)1(

1

2)(

)(1

)(ˆ2

1

2

22

211

22

1

2

1

2

2yVA

mAn

ff

n

AyyAyyA

nN

nN

AyV

i

n

i

i

N

n

i

iR

n

i

iiR

n

i

ii

N

R ��

�

��

��

��

�

exercício 9.8

Seja um inventário florestal em dois estágios com 20 con-glomerados mensurados. A estrutura espacial do conglomera-do apresenta uma forma cruz de malta, composta por quatro

303


subparcelas retangulares de 10 m de largura por 250 m de com-primento. A distância de cada subunidade ao ponto central foi de 100 m. Os dados para a variável volume de madeira corres-pondente à tipologia de interesse estão apresentados na Tabe-la 9.18. Os cálculos auxiliares para obter as estimativas estão apresentados na Tabela 9.19.

Ai = variável auxiliar que corresponde à área de ocorrência da tipologia de interesse no conglomerado de 1 ha;

iy = valor médio da variável resposta da tipologia ocorren-te de interesse por subparcela (m3 / 0,25 ha) do i-ésimo conglo-merado;

)(2 yV i é a variância entre as subparcelas do i-ésimo con-glomerado.

tabela 9.18 - Conglomerados (C) em dois estágios por tipologia florestal.

C S1 S2 S3 S4 TOTAL Ai

(ha)

1 43,7500 42,5000 32,7500 57,1000 176,100 1,000002 53,9200 33,0750 24,1500 46,2070 157,352 0,747483 62,1200 58,8000 55,4000 31,6000 207,920 0,800004 58,6200 57,3750 31,8750 32,3170 180,187 0,899955 51,1000 43,5000 58,2500 68,2500 221,100 1,000006 68,0000 75,5000 37,2800 64,3300 245,110 1,000007 32,0320 24,3600 40,1100 54,2100 150,712 0,749708 60,1000 78,7000 58,3300 37,2700 234,400 1,000009 63,7500 79,9000 75,1300 42,2300 261,010 1,00000

10 42,3980 46,8945 30,0645 57,6000 176,957 0,9582911 88,1700 67,3000 65,2800 37,1300 257,880 1,0000012 24,4620 31,4010 57,8700 52,3530 166,086 0,9000013 58,9000 24,1200 24,5750 29,4450 137,040 0,7061014 62,9200 55,3755 41,0020 35,2640 194,562 1,0000015 60,5900 38,8080 50,2470 38,7500 188,395 0,9503916 35,3500 63,2300 70,9000 85,1400 254,620 1,0000017 36,1125 29,1750 46,0275 51,4900 162,805 0,7990418 38,7500 45,1700 40,4400 39,8900 164,250 1,0000019 23,2000 48,5144 55,5896 32,6832 159,987 0,7821820 59,0700 36,8900 26,1590 39,9910 162,110 0,82164

304


tabela 9.19 - Cálculos auxiliares: conglomerados (C) em dois estágios por tipologia.

C iA iy )(2 yV i ii yA 2)( ii yA ii yA2 2iA )(2

2 yVA ii

1 1,00000 44,0250 100,161 44,0250 1938,20 44,0250 1,00000 100,1612 0,74748 39,3380 176,573 29,4044 864,62 21,9792 0,55873 98,6563 0,80000 51,9800 192,124 41,5840 1729,23 33,2672 0,64000 122,9604 0,89995 45,0468 223,920 40,5396 1643,46 36,4834 0,80990 181,3535 1,00000 55,2750 111,094 55,2750 3055,33 55,2750 1,00000 111,0946 1,00000 61,2775 277,556 61,2775 3754,93 61,2775 1,00000 277,5567 0,74970 37,6780 162,823 28,2472 797,90 21,1769 0,56205 91,51408 1,00000 58,6000 287,101 58,6000 3433,96 58,6000 1,00000 287,1019 1,00000 65,2525 281,469 65,2525 4257,89 65,2525 1,00000 281,46910 0,95829 44,2393 129,958 42,3938 1797,24 40,6254 0,91831 119,34211 1,00000 64,4700 439,277 64,4700 4156,38 64,4700 1,00000 439,27712 0,90000 41,5215 259,349 37,3694 1396,47 33,6324 0,81000 210,07213 0,70610 34,2600 275,644 24,1910 585,20 17,0813 0,49858 137,43014 1,00000 48,6404 162,181 48,6404 2365,89 48,6404 1,00000 162,18115 0,95039 47,0988 110,121 44,7620 2003,64 42,5412 0,90323 99,46516 1,00000 63,6550 438,483 63,6550 4051,96 63,6550 1,00000 438,48317 0,79904 40,7013 99,5590 32,5220 1057,68 25,9865 0,63847 63,56518 1,00000 41,0625 7,9940 41,0625 1686,13 41,0625 1,00000 7,99419 0,78218 39,9968 217,102 31,2847 978,73 24,4703 0,61181 132,82420 0,82164 40,5275 187,932 33,2991 1108,83 27,3599 0,67510 126,872

Total 18,1148 887,860 42.664 826,860 16,6262 3489,4

a) valor médio por razão estimado

ham

A

yA

yn

i

i

n

i

ii

R25,0/0130,49

1148,18

86,887 3

1

1 ��

�

�

�

�

b) variância da média por razão estimada

Dado que:

��

�

��

�

��

�n

i

i

i

ii

N

n

i

iR

n

i

iiR

n

i

ii

N

R yVm

fA

An

f

n

AyyAyyA

nN

nN

AyV

1

2

2

2

22

11

22

1

2

1

2

2)(ˆ)1(

1

2)(

)(1

)(ˆ

305


Como 22 ff i = e :21 nmmm === L

Então:

Portanto:

Utilizou-se n

AA

n

ii

n

∑== 1 devido ao desconhecimento de .NA

Os cálculos para obtenção dos intervalos de confiança e dimensionamento da amostra seguem a metodogia já vista an-teriormente.

9.7 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ES-TáGIOS: ANáLISE ESTATíSTICA CONSIDERANDO A OCOR-RêNCIA DE UMA VARIáVEL AUxILIAR

Seja uma amostra por conglomerado em dois estágios, com cada conglomerado constituído por m subparcelas onde em cada subparcela foi registrado o valor da variável de interesse y e medido também a variável auxiliar (x) que geralmente é corre-lacionada com y.

;1000

201

��N

nf ;

196

422

��M

mf

M

mf

i

i

i196

422 �� ff i

)(ˆ)1(

1

2)(

)(1

)(ˆ2

1

2

22

211

22

1

2

1

2

2yVA

mAn

ff

n

AyyAyyA

nN

nN

AyV

i

n

i

i

N

n

i

iR

n

i

iiR

n

i

ii

N

R ��

�

��

��

��

�

4,348949057,020

)196

41(

1000

20

)19

6262,16013,4986,826013,4920,664.42)(

100020

201000(

9057,0

1)(ˆ

22

2

2

�

��

�

�

��

�

��

RyV

23 )25,0/(928057848,4052087941,062696993,8105973479,0)(ˆ hamyVR

��

306



Seja yij a variável de interesse correspondente à j-ésima subparcela do i-ésimo conglomerado e xij a variável auxiliar (co-variável). Da teoria da estimativa por razão, como visto ante-riormente, pode-se escrever o valor médio e sua variância por subparcela, respectivamente:

a) estimativa da razão

∑∑

∑∑

= =

= ==n

i

m

jij

n

i

m

jij

x

y

R

1 1

1 1ˆ

b) valor médio estimado por razão

XRyR ×= ˆ

c) variância estimada do valor médio por razão

.iy = valor total da variável de interesse referente ao i-ési-mo conglomerado;

.ix = valor total da variável auxiliar referente ao i-ésimo conglomerado.

Em uma amostra por conglomerados em dois estágios, quando nmmm === L21 e ,22 ff i = tem-se que a estimativa da variância de Ry é:

��

�

��

��

��

�n

i

i

i

ii

N

n

i

i

n

i

ii

n

i

i

N

R yVm

fx

Xn

f

n

xRyxRy

nN

nN

XyV

1

22

2

.

22

11

2

.

2

1

..

1

2

.

2)(ˆ)1(

)1

ˆˆ2

)((1

)(ˆ

307


Dado que:

;1 N

nf = ;2 M

mf = 1

)(

)(ˆ

2

1

1

2

2 −

−=

∑∑ =

=

m

m

yy

yV

m

iijm

jij

i

)(2 yV i é a variância da variável de interesse das subparce-las dentro do i-ésimo conglomerado.


exercício 9.9

Seja um censo realizado pela Empresa Florestal CIKEL de uma área de 1.392 ha de Floresta Ombrófila Densa consideran-do todas as árvores com DAP ≥ 30 cm, localizada no município de Portel, estado do Pará. Os dados foram georeferenciados. Desta população foram selecionados aleatoriamente 30 conglo-merados com formato cruzado e cada um foi constituído de 8 subparcelas retangulares de 20 m de largura por 50 m de com-primento (0,10 ha) ( ver a forma d de conglomerado no item 9.10). A estrutura espacial de cada conglomerado abrange uma de área de 16 ha (unidade primária). A Tabela 9.20 mostra os dados observados para o volume de madeira (y) e número de ár-vores (x) por parcela. A Tabela 9.21 mostra os cálculos auxiliares para obter as estimativas.

)(ˆ)1()

1

ˆˆ2

)((1

)(ˆ2

1

2

.22

211

2

.

2

1

..

1

2

.

2yVx

Xmn

ff

n

xRyxRy

nN

nN

XyV i

n

i

i

N

n

i

i

n

i

ii

n

i

i

N

R ��

�

��

��

��

�

308


Sejam os valores populacionais obtidos no censo: O valor médio populacional do volume de madeira consideran-

do todas as árvores com DAP ≥ 30 cm é igual a =Y 57,6968 m3/ha e a variância igual a .)/(6930,1189)( 23 hamyV = (m

3/ha)2. O valor médio populacional do número de árvores consi-

derando todas as árvores com DAP ≥ 30 cm é igual a =NX20,59571 árvores / ha.

Usando t = 2,00. Calcular:

1) Variância da média a partir da subparcela sem conside-rar a variável auxiliar )(1 yV .

2) Variância da média concernente à subparcela conside-rando a estimativa por razão )(2 RyV .

3) Variância da média considerando o conglomerado como unidade de observação (metodologia da amostra simples ao acaso) )(3 yV .

4) Variância da média por razão considerando o conglo-merado como unidade de observação (metodologia da mostra simples por razão) )(4 RyV .

5) Discutir a eficiência dos procedimentos.

309


tabela 9.20 - Dados observados no inventário florestal.

C S VT x C S VT x C S VT x C S VT x C S VT x C S VT x

1 1 6,054 1 6 1 9,696 1 11 1 0,000 0 16 1 10,193 6 21 1 0,000 0 26 1 1,958 1

1 2 3,622 2 6 2 0,000 0 11 2 0,000 0 16 2 23,242 6 21 2 0,000 0 26 2 4,857 2

1 3 6,037 2 6 3 1,251 1 11 3 7,835 2 16 3 3,468 2 21 3 0,000 0 26 3 17,002 3

1 4 7,297 4 6 4 1,047 1 11 4 10,236 4 16 4 1,280 1 21 4 0,000 0 26 4 2,423 1

1 5 5,671 3 6 5 1,844 1 11 5 1,064 1 16 5 9,039 4 21 5 1,850 1 26 5 0,000 0

1 6 21,827 8 6 6 0,000 0 11 6 9,725 3 16 6 5,893 3 21 6 0,000 0 26 6 0,000 0

1 7 4,503 3 6 7 1,425 1 11 7 6,152 1 16 7 13,539 6 21 7 0,000 0 26 7 2,136 1

1 8 8,712 3 6 8 0,000 0 11 8 0,000 0 16 8 2,683 2 21 8 0,000 0 26 8 2,813 2

2 1 11,744 2 7 1 21,803 5 12 1 4,007 2 17 1 10,226 4 22 1 5,176 3 27 1 11,481 5

2 2 13,607 5 7 2 4,304 2 12 2 0,000 0 17 2 0,000 0 22 2 0,000 0 27 2 4,064 2

2 3 11,768 4 7 3 0,000 0 12 3 12,233 4 17 3 11,902 6 22 3 0,000 0 27 3 11,862 4

2 4 0,776 1 7 4 3,995 2 12 4 1,534 1 17 4 0,000 0 22 4 0,000 0 27 4 7,130 3

2 5 13,153 5 7 5 2,263 1 12 5 3,887 1 17 5 20,868 6 22 5 0,000 0 27 5 6,004 2

2 6 2,423 1 7 6 3,799 2 12 6 14,262 3 17 6 2,470 2 22 6 0,000 0 27 6 8,876 4

2 7 4,051 2 7 7 0,000 0 12 7 3,637 2 17 7 3,010 2 22 7 7,778 3 27 7 13,413 6

2 8 0,000 0 7 8 13,284 3 12 8 6,142 3 17 8 2,689 2 22 8 13,118 3 27 8 0,000 0

3 1 1,706 1 8 1 5,718 3 13 1 0,000 0 18 1 1,234 1 23 1 15,844 5 28 1 12,175 5

3 2 0,000 0 8 2 4,566 3 13 2 0,000 0 18 2 4,982 3 23 2 8,277 4 28 2 37,932 4

3 3 0,000 0 8 3 6,427 3 13 3 0,000 0 18 3 4,964 2 23 3 2,878 2 28 3 3,045 1

3 4 3,190 1 8 4 0,000 0 13 4 0,000 0 18 4 0,000 0 23 4 2,265 2 28 4 0,000 0

3 5 2,290 2 8 5 5,974 5 13 5 0,000 0 18 5 13,317 3 23 5 7,575 3 28 5 6,828 3

3 6 3,178 1 8 6 7,603 5 13 6 0,000 0 18 6 4,763 3 23 6 4,320 1 28 6 2,244 1

3 7 0,000 0 8 7 1,759 2 13 7 2,030 1 18 7 0,000 0 23 7 1,689 1 28 7 5,942 3

3 8 5,120 2 8 8 0,000 0 13 8 0,000 0 18 8 1,037 1 23 8 5,735 2 28 8 8,929 3

4 1 13,136 2 9 1 15,739 4 14 1 0,000 0 19 1 8,788 3 24 1 0,000 0 29 1 7,143 3

4 2 11,752 5 9 2 1,224 1 14 2 0,000 0 19 2 8,346 4 24 2 0,000 0 29 2 3,898 2

4 3 0,000 0 9 3 10,721 3 14 3 0,000 0 19 3 1,715 1 24 3 8,206 2 29 3 1,320 1

4 4 7,206 2 9 4 8,803 3 14 4 1,601 1 19 4 0,000 0 24 4 6,258 2 29 4 7,600 3

4 5 7,791 3 9 5 10,691 3 14 5 0,000 0 19 5 0,000 0 24 5 4,497 2 29 5 4,647 2

4 6 0,000 0 9 6 7,896 5 14 6 0,000 0 19 6 5,865 1 24 6 4,965 3 29 6 10,880 4

4 7 20,017 6 9 7 33,005 5 14 7 0,000 0 19 7 11,144 4 24 7 4,005 2 29 7 3,638 1

4 8 17,326 7 9 8 6,130 1 14 8 6,020 3 19 8 2,350 1 24 8 7,649 4 29 8 7,760 4

5 1 11,067 4 10 1 0,000 0 15 1 0,000 0 20 1 3,101 2 25 1 6,510 2 30 1 2,092 1

5 2 5,222 1 10 2 0,000 0 15 2 11,043 3 20 2 0,000 0 25 2 6,791 3 30 2 4,856 1

5 3 0,000 0 10 3 4,213 2 15 3 6,283 2 20 3 6,770 2 25 3 4,262 2 30 3 16,119 4

5 4 1,763 1 10 4 0,000 0 15 4 4,458 2 20 4 14,389 5 25 4 2,887 1 30 4 38,281 7

5 5 7,518 3 10 5 5,696 3 15 5 4,657 2 20 5 0,000 0 25 5 7,666 3 30 5 10,716 2

5 6 3,645 2 10 6 10,314 3 15 6 11,317 4 20 6 13,093 3 25 6 14,333 3 30 6 8,586 3

5 7 1,695 1 10 7 11,751 5 15 7 9,003 2 20 7 8,604 5 25 7 13,384 4 30 7 6,944 2

5 8 0,000 0 10 8 5,967 3 15 8 4,096 1 20 8 0,000 0 25 8 10,346 2 30 8 0,000 0

310


tabela 9.21 - Cálculos auxiliares: ocorrência de uma variável auxiliar.

C .ix .iy .. ii yx 2.iy 2

.ix )(2 yV i )(ˆ2

2 yVx ii

1 26 63,720 1656,72 4060,24 676 33,810 22855,62 20 57,520 1150,40 3308,55 400 34,840 13936,03 7 15,484 108,39 239,75 49 3,525 172,74 25 77,230 1930,75 5964,47 625 54,090 33806,35 12 30,910 370,92 955,43 144 15,160 2183,06 5 15,260 76,30 232,87 25 10,430 260,87 15 49,450 741,75 2445,30 225 57,180 12865,58 21 32,050 673,05 1027,20 441 9,010 3973,49 25 94,210 2355,25 8875,52 625 90,830 56768,8

10 16 37,940 607,04 1439,44 256 21,470 5496,311 11 35,010 385,11 1225,70 121 20,930 2532,512 16 45,700 731,20 2088,49 256 25,210 6453,813 1 2,030 2,03 4,12 1 0,515 0,514 4 7,621 30,48 58,08 16 4,506 72,115 16 50,860 813,76 2586,74 256 15,080 3860,516 30 69,340 2080,20 4808,04 900 51,960 46764,017 22 51,170 1125,74 2618,37 484 53,840 26058,618 13 30,300 393,90 918,09 169 19,620 3315,819 14 38,210 534,94 1460,00 196 18,780 3680,920 17 45,960 781,32 2112,32 289 34,850 10071,721 1 1,850 1,85 3,42 1 0,428 0,422 9 26,070 234,63 679,64 81 24,910 2017,723 20 48,580 971,60 2360,02 400 21,390 8556,024 15 35,580 533,70 1265,94 225 9,670 2175,825 20 66,180 1323,60 4379,79 400 16,840 6736,026 10 31,190 311,90 972,82 100 30,460 3046,027 26 62,830 1633,58 3947,61 676 20,170 13634,928 20 77,100 1542,00 5944,41 400 145,730 58292,029 20 46,890 937,80 2198,67 400 9,190 3676,030 20 87,590 1751,80 7672,01 400 147,270 58908,0

Total 477 1333,84 25.792,0 75.853,0 9237,0 412.171,0

311


Sejam as seguintes informações preliminares:

tabela 9.22 - Análise de variância da variável de intersse (y).

CV GL SQ QMEntre 29 2068,594106 71,330831

Dentro 210 7011,720746 33,389146Total 239 9080,314852 37,992949

De acordo com as informações da Tabela 9.22 da análise de variância tem-se o valor do coeficiente de correlação intra-conglomerado.

;16010,0

16��

ha

haM ;87

16

1392��

ha

haN ;8�m ;3448,0

87

301

��N

nf

;05,0160

82 ��

M

mf

;/59571,20 haárvoresX N �

;8,0/476568,16 haárvoresX N � haárvoresX N 10,0/059571,2�

;4771

.��

�n

i

ix ;8,0/9,1530

4771

.

haárvoresn

x

X

n

i

i

n ��

��

;/875,19 haárvoresX n � ;84,333.11

.��

�n

i

iy ��

�n

i

iy

1

2

.;06,853.75

;0,92371

2

.��

�n

i

ix ;0,792.251

..��

�

n

i

iiyx �

�

�n

i

iiyVx

1

2

2

.0,171.412)(ˆ

)(ˆ)1)(1(

)(ˆ)1(ˆ)1(ˆyVmnm

yVnmMQmn Entre

��

��

117498097,0992949,37)18()1308(

992949,37)1830(330831,718)130(ˆ ��

��

312


1) variância da média a partir da subparcela sem consi-derar a variável auxiliar )(1 yV

a) valor médio estimado por subparcela

hamnm

y

y

n

i

m

j

ij

10,0/557666667,5830

84,333.1 31 1�

��

��

hamy /5767,553

�

b) variância sem considerar a variável auxiliar )(1 yV

Sabe-se que:

231

2

1 )10,0/(916353875,81

)(

)(ˆ hamn

yy

yV

n

i

i

��

�

�

��

231

2

1

2 )10,0/(389146,33)1(

)(

)(ˆ hammn

yy

yV

n

i

i

m

j

ij

��

�

�

��

É importante notar que (ver Tabela 9.22):

231

2

1 )10,0/(916353875,88

330831,71ˆ

1

)(

)(ˆ hamm

MQ

n

yy

yVEntre

n

i

i

��

�

�

��

231

2

1

2)10,0/(389146,33ˆ

)1(

)(

)(ˆ hamMQmn

yy

yVDen tro

n

i

i

m

j

ij

��

�

�

��

Logo:

mn

yVff

n

yVfyV

)(ˆ)1(

)(ˆ)1()(ˆ 2

211

1 ��

308

389146,33)05,01(3448,0

30

916353875,8)3448,01()(ˆ

1�

��yV

23

1)10,0/(240303788,0)(ˆ hamyV �

hamyVys 10,0/490207902,0240303788,0)(ˆ)(3

1 ��

313


c) intervalo de confiança para o valor médio sem conside-rar a variável auxiliar número de árvores

Limite inferiorhamystyIC /7725,459021,400,25767,55)(: 3

1 ��

Limite superior

d) limite de erro a partir da subparcela desconsiderando a variável auxiliar (LE1).

%64,1710055766667,5

490207902,000,2100

)(1

1��

��

�

�

y

ystLE

2) variância da média por meio da subparcela conside-rando a estimativa por razão )(2 RyV

a) estimativa da razão

796310,2477

84,333.1ˆ

1 1

1 1��

��

��

� �

� �

n

i

m

j

ij

n

i

m

j

ij

x

y

R

b) estimativa do valor médio por razão

hamXRy NR 10,0/75919898,5059571,2796310,2ˆ 3��

hamyR

/591990,573

�

c) estimativa da variância do valor médio por razão

Dado que nmmm === L21 e ,22 ff i = tem-se a estimativa da variância de Ry :

314


Usando os cálculos contidos na Tabela 9.21:

0,171.412476568,16830

)160

81(

87

30

29

0,9237796310,20,792.25796310,2206,853.75)

8730

3087(

476568,16

1)(ˆ

22

2

22

��

�

�

��

�

��

RyV

232 )10,0/(079717259,0)(ˆ hamyV R �

23

2 )/(9717259,7)(ˆ hamyV R �

hamys R 10,0/282342449,0079717259,0)( 3

2 ��

y; s R)(2 �� 3m / ha

d) intervalo de confiança para o valor médio a partir da subparcela considerando a estimativa por razão

Limite inferiorhamystyIC

RR/94519,518234,200,259199,57)(:

3

2��

Limite superiorhamystyIC

RR/23879,638234,200,259199,57)(:

3

2��

e) limite de erro para o valor médio por meio da subparcela considerando a estimativa por razão (LE2)

%80,910075919898,5

282342449,000,2100

)(2

��

�

��

�

�

R

R

y

ystLE

Se considerado desconhecido o valor de NX e utilizando

Nn XX = , ter-se-á:

)(ˆ)1()

1

ˆˆ2

)((1

)(ˆ2

1

2

.22

211

2

.

2

1

..

1

2

.

2yVx

Xmn

ff

n

xRyxRy

nN

nN

XyV

i

n

i

i

N

n

i

i

n

i

ii

n

i

i

N

R ��

�

��

��

��

�

315


Seja o limite de erro para o valor médio por razão a partir da subparcela usando

Nn XX = .

Sendo:

3) variância da média considerando o conglomerado como unidade de observação (metodologia da amostra sim-ples ao acaso) )(3 yV

a) estimativa do valor médio

9,1530

4771 ��

��

n

x

X

n

i

i

n

0,171.4129,15830

)160

81(

87

30

29

0,9237796310,20,792.25796310,2206,853.75)

8730

3087(

9,15

1)(ˆ

22

2

22

��

�

�

��

�

��RyV

23

2 )10,0/(085603518,0)(ˆ hamyV R �

23

2)/(5603518,8)(ˆ hamyV

R�

hamyVys RR 10,0/292580789,0085603518,0)(ˆ)(3

2 ��

hamn

y

y

n

i

m

j

ij

8,0/4613,4430

84,333.1 31 1��

��

hamy /5767,553

�

316


b) variância do valor médio estimado

Sabe-se que:

23

21

2

.

1

2

.

. )8,0/(6447,57029

30

84,1333853.75

1

)(

)( hamn

n

y

y

yV

n

i

in

i

i

i �

�

��

�

�

��

�

�

23

.)/(6323,891)( hamyV

i�

Então:23.

3 )8,0/(46235552,1230

6447,570)

87

3087(

)(ˆ)()(ˆ ham

n

yV

N

nNyV

i��

��

��

23

3)/(4724305,19)(ˆ hamyV �

) ;8,0/(5302,3)( 3

3hamys � )(

3ys ��

3/ ham

c) intervalo de confiança para a média considerando o con-glomerado como unidade de observação (metodologia da amos-tra simples ao acaso)

Limite inferiorhamystyIC /7511,464128,400,25767,55)(: 3

3��

Limite superiorhamystyIC /4023,644128,400,25767,55)(: 3

3��

d) intervalo de confiança para a variância

95,0])(ˆ)1(

)()(ˆ)1(

[22

��

��

InfSup

yVnyV

yVnP

��

95,0]6323,891)130(

)(6323,891)130(

[2

975,0

2

025,0

��

��

��yVP

317


Sendo:

Conforme informado no presente exercício, a variância po-pulacional é .)/(6930,1189)( 23 hamyV = (m3 / ha)2. Verifica-se que este valor está contido no intervalo de confiança.

e) limite de erro para o valor médio estimado considerando o conglomerado como unidade de observação. Metodologia da amostra simples ao acaso ( LE3).

4) variância da média por razão considerando o con-glomerado como unidade de observação. metodologia da amostra simples por razão ( )(4 RyV )

a) estimativa do valor médio por razão

b) estimativa da variância da razão

0,162

975,0;29 ��

7,452

025,0;29 ��

95,0]0,16

6323,891)130()(

7,45

6323,891)130([ �

��

�yVP

95,0])/(0835,616.1)()/(8061,565[ 233 �� hamyVhamP

%88,151004613,44

5302,300,2100

)(3

��

�

��

�

�

y

ystLE

hamXRy nR 8,0/07359186,46476568,16796310,2ˆ 3��

hamyR

/59198983,573

�

)1

ˆˆ2

)((1

)ˆ(ˆ 1

2

.

2

1

..

1

2

.

2 �

��

�

��

n

xRyxRy

nN

nN

XRV

n

i

i

n

i

ii

n

i

i

N

)29

237.9796310,2792.25796310,22853.75)(

8730

3087(

476568,16

1)ˆ(ˆ

2

24

��

�

��RV

020093329172,0)ˆ(ˆ4 �RV

318


c) estimativa da variância do valor médio por razão2322

4)8,0/(533675098,220933291720,0476568,16)ˆ(ˆ)(ˆ hamRVXyV

NR��

23

4 ) ;/(958867341,3)(ˆ hamyV R �

hamysR

8,0/59175221,1533675098,2)(3

4��

ysR

)(4

��3/ ham

d) intervalo de confiança para o valor médio considerando o conglomerado como unidade de observação. Metodologia da amostra simples ao acaso por razão: )(4 RyV

Limite inferiorhamystyIC

RR/6124,539897,100,259199,57)(:

3

4��

Limite superiorhamystyIC

RR/5714,5619897,100,259199,57)(:

3

4��

e) limite de erro da média por razão considerando o conglo-merado como unidade de observação. Metodologia da amostra simples por razão (LE4)

%91,61000735591,46

59175221,100,2100

)(4

4��

�

��

�

�

y

ystLE

Se considerado desconhecido o valor de NX e utilizando

Nn XX = , ter-se-á:

9,1530

4771 ��

��

n

x

X

n

i

i

n

hamXRy nR 8,0/461329,449,15796310,2ˆ 3��

)1

ˆˆ2

)((1

)ˆ(ˆ 1

2

.

2

1

..

1

2

.

2 �

��

�

��

n

xRyxRy

nN

nN

XRV

n

i

i

n

i

ii

n

i

i

n

)29

237.9796310,2792.25796310,22853.75)(

8730

3087(

9,15

1)ˆ(ˆ

2

24

��

�

��RV

011425139,0)ˆ(ˆ4

�RV

2322

4 )8,0/(888389391,2011425139,09,15)ˆ(ˆ)(ˆ hamRVXyV nR ��

23

4)/(513108423,4)(ˆ hamyV

R�

hamysR

8,0/699526225,1888389391,2)(3

4��

319


Seja o limite de erro para o valor médio por razão conside-rando o conglomerado como unidade de observação, mas usan-do .Nn XX = Metodologia da amostra simples ao acaso por razão.

Tal que:

5) Discutir a eficiência dos procedimentos

tabela 9.23 - Resultados das estimativas.

Estimativas LE(%) Média (ha) Variância da média (ha)1 ASA(subp)

2 Razão (subp)3 ASA (cong)

4 Razão (cong)

17,64 9,8015,88 6,91

55,576757,592055,576757,5920

24,0303788 7,9717259 19,4724305

3,958867341

A partir dos resultados apresentados na Tabela 9.23, sejam as eficiências calculadas como o quociente entre os limites de erro:

9,1530

4771 ��

��

n

x

X

n

i

i

n

hamXRy nR 8,0/461329,449,15796310,2ˆ 3��

)1

ˆˆ2

)((1

)ˆ(ˆ 1

2

.

2

1

..

1

2

.

2 �

��

�

��

n

xRyxRy

nN

nN

XRV

n

i

i

n

i

ii

n

i

i

n

)29

237.9796310,2792.25796310,22853.75)(

8730

3087(

9,15

1)ˆ(ˆ

2

24

��

�

��RV

011425139,0)ˆ(ˆ4

�RV

2322

4 )8,0/(888389391,2011425139,09,15)ˆ(ˆ)(ˆ hamRVXyV nR ��

23

4)/(513108423,4)(ˆ hamyV

R�

hamysR

8,0/699526225,1888389391,2)(3

4��

%12,6100576666,55

699526225,100,2100

)(4

��

�

��

�

�

R

R

y

ystLE

haárvoresX n 8,0/9,1530

477��

hamXRynR

8,0/461329,449,15796310,2ˆ 3��

hamyR

/57666,553

�

320


Os resultados denotam que:

a) a estimativa da média por razão por meio da subparcela é 80% mais eficiente que a análise a partir da subparcela sem considerar a variável auxiliar, pois: EF12 = 1,8000;

b) a estimativa da média quando se considera o conglome-

rado como unidade de observação (metodologia da amostra sim-ples ao acaso) é 11,08% mais eficiente que a análise a partir da subparcela sem considerar a variável auxiliar, pois: EF13 = 1,1118;

c) a estimativa da média por razão quando se considera o conglomerado como unidade de observação (metodologia da amostra simples ao acaso) é 155,28% mais eficiente que a esti-mativa da média a partir da subparcela sem considerar a variá-vel auxiliar, pois: EF14 = 2,5528;

d) a estimativa da média por razão por meio da subparcela

é 62,04% mais eficiente que a estimativa da média quando se considera o conglomerado como unidade de observação sem considerar a variável auxiliar (metodologia da amostra simples), pois: EF32 = 1,6204;

321


e) a estimativa da média por razão quando se considera o conglomerado como unidade de observação (metodologia da amostra simples por razão) é 41,82 % mais eficiente que a esti-mativa por razão a partir da subparcela, pois: EF24 = 1,4182;

f) a estimativa da média por razão quando se considera

o conglomerado como unidade de observação (metodologia da amostra simples por razão) é 129,81 % mais eficiente que a es-timativa a partir do conglomerado como unidade de observação sem considerar a variável auxiliar, pois: EF34 = 2,2981;

Considerando todos os procedimentos, verifica-se que a análise por razão considerando o conglomerado como unida-de de observação (metodologia da amostra simples por razão) apresentou maior precisão.

A maior precisão das estimativas por razão pode ser expli-cada pelo alto valor do coeficiente de correlação entre .ix e ,.iyque é de 0,876463.

Pode ser verificado que o valor médio populacional (57,6968 m3/ha) está dentro dos intervalos de confiança dos quatro métodos utilizados. Observa-se (ver Tabela 9.23) que a estimativa do valor médio por razão (57,5920) está mais próxima do parâmetro populacional que a estimativa sem considerar a variável auxiliar número de árvores (55,5767).

Como em alguns casos o valor médio da variável auxiliar é desconhecido, então, se a amostra é grande pode-se usar a sua estimativa ou proceder a uma dupla amostragem. Neste exercí-cio, o limite de erro da média por razão apresentou o valor 10,53% quando usada a média estimada .10,0/9875,1 haárvoresX

n� Este

limite de erro é 7,44 % maior que o valor de 9,80 % que corres-ponde ao uso de NX .

322


O limite de erro por razão considerando o conglomerado como unidade de observação (metodologia da amostra simples por razão) usando 9,15=nX = 15,9 árvores/ha apresentou o valor de 6,12%. Este resultado corresponde a 88,57% do valor de 6,91% que se refere ao uso de NX .

O valor do coeficiente de correlação intraconglomerado foi 117498097,0ˆ =d que, sob 0: =doH , resultou não significativo (t = 1,7146), recomendando o uso da amostragem por conglo-merados.

9.8 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ES-TáGIOS PELAS PROPORçõES

Seja um inventário florestal composto de n conglomerados estruturados com m subparcelas, as quais podem ser classi-ficadas em duas categorias, C1 e C0. Admitindo que qualquer subparcela do conglomerado pertença a uma das duas catego-rias, C1 e C0, onde C1 corresponde às subparcelas que possuem o atributo desejado e C0 define os dados que não o possuem.

Seja a seguinte notação:ai = número de subparcelas pertencente à categoria C1 no

conglomerado de ordem i;N = número total de conglomerados da população;n = número de conglomerados amostrado;m = número de subparcelas por conglomerado;

map ii /= é proporção de subparcelas pertencentes à ca-tegoria C1 no conglomerado de ordem i.


a) valor estimado da proporção

323


Para quantificar os resultados, seja a seguinte regra para qualquer subparcela yij da amostra ou da população:

yij = 1, se yij estiver contido em C1;yij = 0, se yij estiver contido em C0;Para a amostra de valores yij , resulta que:

∑=

=m

jiij ay

1

Daí, para o conglomerado de ordem i , tem-se:

m

a

m

yp ii

i ==

ip é a proporção de subparcelas do conglomerado i , per-tencente à categoria C1.

b) variância estimada da proporção

Considerando uma amostra aleatória de n conglomerados, define-se como valor de p a média das observações obtidas de pi na amostra, onde p é uma estimativa da proporção P popula-cional.

Dado que map ii /= , logo: ��

�

��n

i

n

i

i

inm

a

pn

p1

11 .

Então:

1

)(

)(ˆ 1

2

12

1 −

−=∑

∑=

=

nn

pp

yV

n

I

n

Ii

i

324


Dado que:

)1()(ˆ 1

2 −=

∑=

m

qpmyV

n

Iii

i, sendo

)1()(ˆ 1

2 −=

∑=

mn

qpmyV

n

Iii

Então:


exercício 9.10

Seja uma área plantada com uma espécie florestal no es-paçamento de 5 m x 5 m e constituída por 100 talhões de formato quadrado de 1 ha, donde foi retirada uma amostra de 10 talhões e verificado em cada um deles, por meio de um conglomerado composto por 40 árvores (subparcelas), o número de árvores que apresentavam os sintomas de uma determinada doença. As subparcelas dentro dos conglomerados foram implantadas considerando uma estrutura sistemática com uma equidistância K = 400 / 40 = 10. O objetivo é conhecer a ocorrência dessa ca-racterística. Os dados estão apresentados na Tabela 9.24.

Sabe-se:Área = 100 ha;Área do conglomerado ou unidade primária = 1 ha; Número total de conglomerados ( 100=N );Número de conglomerados amostrado (n =10);

)(ˆ)1()(ˆ)

1()(ˆ

2

21

1

1 yVnm

ffyV

n

fpV

��

��

325


Número de subparcelas por conglomerado (m = 40).

tabela 9.24 - Número de árvores por conglomerado (ai ) com sintomas da doença.

C ai pi = ai / 40 qi piqi

1 0 0,000 1,000 0,000000

2 3 0,075 0,925 0,069375

3 2 0,050 0,950 0,047500

4 4 0,100 0,900 0,090000

5 2 0,050 0,950 0,047500

6 1 0,025 0,975 0,024375

7 2 0,050 0,950 0,047500

8 6 0,150 0,850 0,127500

9 3 0,075 0,925 0,069375

10 1 0,025 0,975 0,024375

Total 24 0,600 0,547500


;600,01

��

n

i

ip ;5475,0

1

��

i

n

i

iqp ;0525,0

1

2��

�

n

i

ip ;24

1

��

�n

i

ia

06,010

600,01 ��

��

n

p

p

n

i

i

ou 06,04010

241�

��

��

nm

a

p

n

i

i


Dado que:

00183333,09

10

6,00525,0

1

)(

)(ˆ

2

1

2

12

1 �

�

��

�

�

��

�

�

n

n

p

p

yV

n

I

n

I

i

i

243333,0)110(10

5475,040

)1()(ˆ 1

2�

��

��

��

��

mn

qpm

yV

n

I

ii

1,0100

101 ��

N

nf

05,0400

202 ��

M

mf

326


Então:

O intervalo de confiança e o dimensionamento do inventá-rio definitivo são calculados como já visto anteriormente.

9.9 AMOSTRAGEM POR CONGLOMERADOS EM DOIS ESTá-GIOS PELAS PROPORçõES COM GRANDEzAS DESIGUAIS (Mi)

Dada uma amostragem por conglomerados em dois está-gios, onde cada unidade primária seja constituída por Mi uni-dades secundárias ou subparcelas, tal que cada conglomerado possua mi subparcelas. Admitindo-se que qualquer subparcela do conglomerado, como visto no item 9.8, pertença a uma das duas categorias C1 ou C0.



00183333,09

10

6,00525,0

1

)(

)(ˆ

2

1

2

12

1 �

�

��

�

�

��

�

�

n

n

p

p

yV

n

I

n

I

i

i

243333,0)110(10

5475,040

)1()(ˆ 1

2�

��

��

��

��

mn

qpm

yV

n

I

ii

1,0100

101 ��

N

nf

05,0400

202 ��

M

mf

)(ˆ)1()(ˆ)

1()(ˆ

2

21

1

1 yVnm

ffyV

n

fpV

��

��

243333,04010

)05,01(1,000183333,0)

10

1,01()(ˆ

�

�

��

��pV

8750002227912,08750000577915,00001649997,0)(ˆ��pV

014926194,0)( �ps

327


No caso de ocorrer variação no tamanho do conglomerado (unidade primária), então p é uma estimativa por razão, ou seja:

iii Map /= , logo: ∑

∑

=

==n

ii

n

iii

R

M

pMp

1

1


Dado que:

∑

∑

=

==n

ii

n

iii

R

M

pMp

1

1

Por conseguinte, a estimativa da variância é dada pela ex-pressão:

)(ˆ)1(]

1

2)(

)[(1

)(ˆ2

1

2

2

22

11

22

1

2

1

2

2yV

m

fM

Mn

f

n

MppMppM

nN

nN

MyV i

n

i i

ii

N

n

i

iR

n

i

iiR

n

i

ii

N

R ��

�

��

��

��

�

Tal que:

;1

N

M

M

n

ii

N

∑== )1(

)(ˆ2 −

=i

iiii m

qpmyV

Considerando: 22 ff i = e :21 mmmm n ==== L

)(ˆ)1(]

1

2)(

)[(1

)(ˆ2

1

2

22

211

22

1

2

1

2yVM

Mmn

ff

n

MppMppM

nN

nN

MyV

i

n

i

i

N

n

i

iR

n

i

iiR

n

i

ii

N

R ��

�

��

��

��

�


328


exercício 9.11

Seja uma adaptação do exercício 9.10 considerando variação no tamanho das unidades primárias e também no número de árvo-res (subparcelas). Os dados estão apresentados na Tabela 9.25.

Dado que:Área total = 100 ha;Número total de conglomerados (N = 100); Número de conglomerados amostrado (n = 10).

tabela 9.25 - Número de árvores (ai ) por conglomerado (C) com sintomas da doença.

C Área Mi mi ia iii map /= qi )1(ˆ2 −= iiiii mqpmV

1 0,9 360 37 0 0,000000 1,00000 0,0000002 0,8 320 35 3 0,085714 0,91429 0,0806723 1,1 440 41 2 0,048780 0,95122 0,0475614 1,2 480 43 4 0,093023 0,90698 0,0863795 0,7 280 33 2 0,060606 0,93939 0,0587126 0,8 320 35 1 0,028571 0,97143 0,0285717 0,9 360 37 2 0,054054 0,94595 0,0525538 1,0 400 40 6 0,150000 0,85000 0,1307699 1,0 400 40 3 0,075000 0,92500 0,07115410 1,4 560 47 1 0,021277 0,978723 0,021277

Total 9,8 3920 24

��

�n

i

iM1

3920

��

�n

i

iM1

20,000.600.1

��

�n

i

ii pM1

03,241

400100

000.401��

��

N

M

M

N

i

i

N

��

�n

i

ii pM1

2 0,009.97

��

�n

i

iipM

1

293,598.8)(

9,054.2)(ˆ)1(2

1

2

2

��

��

yVm

fMi

n

i i

ii

329


a) valor médio estimado por razão de P

061714,03920

92,241

1

1 ��

�

�

�

�

n

i

i

n

i

ii

R

M

pM

p

b) variância estimada por razão de pR

)(ˆ)1(]

1

2)(

)[(1

)(ˆ 2

1

2

2

22

11

22

1

2

1

2

2yV

m

fM

Mn

f

n

MppMppM

nN

nN

MyV i

n

i i

ii

N

n

i

iR

n

i

iiR

n

i

ii

N

R ��

�

��

��

��

�

9,054.240010

1,0

)9

000.600.1061487,0009.97061487,0293,598.8)(

10010

10100(

400

1)(ˆ

22

2

2

��

�

��

�

��pV

1930001827423,0250000128431,0)043012,302)(10010

10100(

400

1)(ˆ

2��

�

��pV

013518,0)( �ps


9.10 ESTRUTURAS DE CONGLOMERADOS EM INVENTá-RIOS FLORESTAIS

A configuração estrutural dos conglomerados pode ser or-ganizada de diversas formas, tamanhos e distribuições espa-ciais na floresta. Entretanto, para se definir a forma estrutural

��

�n

i

iM1

3920

��

�n

i

iM1

20,000.600.1

��

�n

i

ii pM1

03,241

400100

000.401��

��

N

M

M

N

i

i

N

��

�n

i

ii pM1

2 0,009.97

��

�n

i

iipM

1

293,598.8)(

9,054.2)(ˆ)1(2

1

2

2

��

��

yVm

fMi

n

i i

ii

330


amostral (conglomerado) em inventários de florestas naturais, as seguintes informações são importantes, como subsídios para se aproximar da estrutura conglomerada ideal:

a) a razão entre os custos de penetração e medição das subparcelas e o custo de reconhecimento e penetração nos con-glomerados;

b) previsão aproximada do valor esperado do coeficiente de correlação intraconglomerado;

c) a área da subunidade.

A diversidade de formas ou estruturas de conglomerados com aplicação na área florestal é bastante ampla. A Figura 9.1 apresenta algumas formas (a, b, c, d) que podem ser utilizadas:

(a) (b) (c) (d)

Figura 9.1 - Formas estruturais de conglomerados (a, b, c, d).

Péllico Netto (1971) realizou um inventário florestal em uma área de 160.980 ha, localizada na região do Alto Turi, município de Santa Helena, no estado do Maranhão. A unidade amostral apresentou uma forma conglomerada, denominada cruz de mal-ta (forma a), onde cada subparcela tinha uma área de 0,25 ha. A distância de cada subparcela em relação ao ponto central do conglomerado foi de 10 m.

Bolfarine e Bussab (2005) citam que uma inconveniência no uso da amostragem em conglomerados é que as subparcelas

331


dentro do conglomerado tendem a ter valores mais homogêneos para as variáveis medidas. Queiroz (1998) explica que o uso de pequenas distâncias entre as subparcelas aumenta o grau de dependência entre as mesmas, pois o coeficiente de correlação intraconglomerado tende a crescer.

Queiroz (1977) estudou a forma estrutural do conglomera-do cruz de malta com o objetivo de pesquisar 25 tamanhos di-ferentes de subparcelas, pelo Método da Curvatura Máxima, vi-sando definir o tamanho ideal. A seguir uma apresentação mais detalhada deste trabalho.

Para estudar o tamanho ótimo da subparcela e a distância ideal dessa ao centro do conglomerado foram consideradas as seguintes variáveis respostas: Vt: Volume de madeira sem cas-ca das árvores com DAP ≥ 25 cm considerando as 167 espécies ocorrentes na área; V1: Volume de madeira sem casca congre-gando somente as espécies pertencentes à classe I que são as espécies com mercado internacional garantido que, segundo Queiroz (1977), no ano de 1977 correspondia a um total de 14 espécies, e Vm: Volume de madeira sem casca somente para a espécie maçaranduba (Manilkara huberi (Ducke). Standl).

O método utilizado para obter o tamanho ideal da subpar-cela, denominado de curvatura máxima, foi proposto por Federer (1955), consistindo em obter um índice que estime a variabilida-de, como a variância ou coeficiente de variação para cada tama-nho de subparcela. Segundo Chacin Lugo (1977), o método da curvatura máxima foi o primeiro a ser utilizado na obtenção do tamanho ideal de parcelas experimentais. Este método consiste em utilizar ensaios de uniformidade compreendendo um conjun-to de unidades básicas.

A partir dos coeficientes de variação (CV) obtidos para cada tamanho de parcela, uma curva é então traçada através

332


das coordenadas resultantes, onde o tamanho ótimo da parcela localiza-se na região de máxima curvatura. Este tamanho é de-terminado de forma visual, adotando-se como tamanho ideal o valor correspondente à abscissa do ponto naquela região.

O tamanho ideal escolhido, localizado na região de máxi-ma curvatura, foi de 0,32 ha. Definido o tamanho da subparcela em 0,32 ha, foram analisados os efeitos na precisão do inven-tário, quando as mesmas estiverem afastadas do ponto central, para 17 distâncias diferentes. Os resultados mostraram que a distância das subparcelas ao ponto central não deve ser inferior a 50 metros para um tamanho de subparcela de 0,32 ha, entre-tanto, os resultados obtidos recomendam que uma distância de 100 m seria melhor.

Os resultados demonstraram que o número de subparcelas aumenta com a diminuição do seu tamanho, o que pode ser per-cebido quando o tamanho é igual a 0,12 ha, onde os coeficientes de correlação intraconglomerado, para as três variáveis respos-tas estudadas, variaram entre os valores de 0,055 a 0,087; e, consequentemente, o número de subparcelas variou de 5,596 a 7,193; denotando ser eficiente uma formatação conglomerada na forma cruzada, mas apresentando oito subparcelas.

Analisando-se a Figura 9.2, com base nas três variáveis respostas referentes aos volumes das espécies em estudo, veri-fica-se que existe uma relação inversamente proporcional da va-riabilidade dos valores do coeficiente de variação em função do tamanho das subparcelas, ou seja, à medida que se aumenta o tamanho da subparcela diminui o valor do coeficiente de variação. Nesse caso, o tamanho da subparcela considerado ideal foi ob-tido por meio de análise visual, com localização centralizada na região de máxima curvatura, correspondendo à soma do total de oito unidades básicas (subsubparcelas), perfazendo uma magni-

333


tude de 0,32 ha. Todavia, verifica-se uma tendência de estabili-zação da curva a partir do tamanho de 0,2 ha, e que o tamanho correspondente a 0,25 ha também pode ser uma boa escolha.

Figura 9.2 - Gráfico de dispersão do coeficiente de variação em função do tamanho das subparcelas para o inventário florestal do Tapajós, município de Santarém-PA, em 1977.

De acordo com as três variáveis respostas referentes aos volumes das espécies em estudo, observou-se que existe uma relação diretamente proporcional da variabilidade do coeficien-te de correlação intraconglomerado em função do tamanho das subparcelas, ou seja, à medida que aumenta o tamanho da subparcela cresce o seu valor, conforme mostra a Figura 9.3. Os valores dos coeficientes de correlação intraconglomerado, considerando um tamanho de subparcela ideal de 0,32 ha, para as três variáveis: Vt (Volume das 167 espécies), d = 0,213; V1 (Volume das espécies da classe I), d = 0,276 e Vm (Volume da espécie Maçaranduba), d = 0,214, ficaram bem abaixo de 0,4, indicando ser um tamanho de subparcela adequado.

050

100150200250300350400450500

0,00 0,20 0,40 0,60 0,80 1,00 1,20

Área da subparcela (ha)

Co

efic

ien

te d

e v

aria

ção

Vt: Volume das 167 espécies V1: Volume das espécies da classe I Vm: Volume da Maçaranduba

334


Figura 9.3 - Gráfico de dispersão para os valores do coeficiente de correla-ção intraconglomerado em função do tamanho das subparcelas para o inven-tário florestal do Tapajós, município de Santarém-PA, em 1977.

Considerando as três variáveis respostas referentes aos volumes das espécies em estudo, constatou-se que existe uma relação inversamente proporcional da variabilidade do número de subparcelas em função do seu tamanho, ou seja, à medida que este aumenta a sua quantidade diminui, estabilizando-se em torno de quatro para 0,32 ha, como apresenta a Figura 9.4. Os resultados mostram que os números de subparcelas corres-pondente ao tamanho de 0,32 ha, para as variáveis em estudo, foram: Vt (Volume das 167 espécies), m = 3,324; V1(Volume das espécies da classe I), m = 2,801; e Vm (Volume da espécie Maçaranduba), m = 3,314.

-0,1

0,0

0,1

0,2

0,3

0,4

0,5

0,00 0,20 0,40 0,60 0,80 1,00 1,20


Co

rrel

ação

in

trac

on

glo

mer

ado


335


Figura 9.4 - Gráfico de dispersão da variação do número de subparcelas em função do tamanho das subparcelas para o inventário florestal do Tapajós, município de Santarém-PA, em 1977.

A Figura 9.5 apresenta, para as três variáveis respostas, a variabilidade do coeficiente de correlação intraconglomerado em função da distância das subparcelas ao centro do conglomera-do. Os valores do coeficiente de correlação intraconglomerado considerando uma distância de 50 m das subparcelas ao centro do conglomerado e com um tamanho 0,32 ha apresentaram os seguintes resultados: Vt = 0,130; V1 = 0,215 e Vm = 0,169. Es-tes valores denotam que o uso de subparcelas com tamanho de 0,32 ha e distantes 50 m do centro do conglomerado cruz de malta estão dentro do limite aceitável por atenderem à condição

4,0≤d .

0

5

10

15

20

25

0,00 0,20 0,40 0,60 0,80 1,00 1,20


Nú

mero

de s

ub

parc

ela

s


336


Figura 9.5 - Gráfico de dispersão da variação do coeficiente de correlação intraconglomerado em função da distância para o inventário florestal do Ta-pajós, município de Santarém, em 1977.

A Figura 9.6 apresenta, para as três variáveis respostas, a variabilidade do número de subparcelas ideal em função da distância das subparcelas ao centro do conglomerado. Os va-lores do coeficiente de correlação intraconglomerado para uma distância de 110 m das subparcelas ao centro do conglomerado, para o tamanho de subparcela de 0,32 ha, apresentaram os se-guintes resultados: Vt = 3,611; V1 = 2,933; e Vm = 2,905. Estes valores denotam que é aceitável estruturar um conglomerado cruz de malta com subparcelas com tamanho de 0,32 ha e dis-tantes 110 m do centro, pois 4,0≤d .

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0 50 100 150 200 250 300 350 400

Distância (m)

Co

rrel

ação

in

trac

on

glo

mer

ado


337


Figura 9.6 - Variação do número de subparcelas em função da distância ao centro do conglomerado.

Os resultados apresentados demonstram que o uso do for-mato conglomerado cruz de malta com subparcelas com tama-nhos de 0,25 ha ou 0,32 ha em Inventários Florestais na Amazô-nia é recomendável, por outro lado, se a área da subparcela for dimensionada para 0,10 ha, o conglomerado deverá ser estrutu-rado com oito subparcelas.

As experiências na realização de Inventários Florestais na Amazônia recomendam que a distância das subparcelas ao cen-tro do conglomerado cruz de malta não deve ser inferior a 50 m, mas, ressalta-se que a distância recomendada é 100 m para um tamanho de subparcela de 0,25 ha. Os resultados demonstram também que se houver a diminuição do tamanho da subparcela, o seu número deverá ser aumentado, o que pode ser percebido quando o tamanho da subparcela é igual a 0,12 ha, onde os valores da correlação intraconglomerado, para as três variáveis respostas, variaram de 0,055 a 0,087 e, consequentemente, o número de subparcelas ideal ficou no intervalo de 5,596 a 7,193; concluindo-se ser eficiente estruturar, para inventários florestais

02468

101214161820

0 100 200 300 400

distância

Nú

mer

o d

e su

bu

nid

ades

Vt

V1

Vm

338


na Amazônia, uma formatação conglomerada cruzada ampliada, ou seja, apresentando uma composição com oito subparcelas de 0,10 ha (Figura 9.7).

Figura 9.7 - Representação esquemática da unidade conglomerada cruz de malta e da unidade cruzada com oito subparcelas do inventário florestal da Flona Tapajós, município de Santarém, em 1977.

Flores (2010) estudou na área de manejo florestal susten-tável de 1400 ha, pertencente à empresa madeireira Cikel Brasil Verde Madeiras Ltda., em região de floresta ombrófila densa, localizada no Alto Pacajá, município de Portel, estado do Pará, a forma estrutural conglomerada cruzada com oito subparcelas (Forma expressa na Figura 9.7) com o objetivo de pesquisar cinco tamanhos diferentes de subparcela, pelo Método da Cur-vatura Máxima, visando definir o tamanho ideal. A seguir uma apresentação mais detalhada deste trabalho.

Para estudar o tamanho ótimo da subparcela e a distância ideal desta ao centro do conglomerado foram consideradas as seguintes variáveis respostas: VT: Volume de madeira com cas-ca das árvores com DAP ≥ 30 cm considerando as 77 espécies ocorrentes na área; VO: Volume de madeira com casca congre-

339


gando somente as 10 espécies de maior ocorrência; VC: Volume de madeira com casca das dez espécies com mercado interna-cional garantido pela Empresa Cikel Brasil Verde Madeiras Ltda.

O tamanho ideal escolhido, localizado próximo à região de máxima curvatura, foi de 0,10 ha. Definido o tamanho da subpar-cela em 0,10 ha, foram analisados os efeitos na precisão do inventário para cinco diferentes distâncias entre as subparcelas, os resultados mostraram que a distância entre as subparcelas deve ser de 50 m, ou seja, o autor confirmou que a formatação conglomerada cruzada com oito subparcelas de 0,10 ha é reco-mendável (Figura 9.7).

Pinheiro (2011) aplicou a estrutura conglomerada cruzada com oito subparcelas de 0,8 ha, formato apresentado na Figura 9.7, em um inventário florestal localizado no município de Portel, estado do Pará, considerando a variável resposta volume com DAP ≥ 30 cm para todas as espécies ocorrentes. Referido autor obteve para o coeficiente de correlação intraconglomerado o va-lor de 0,1770; o qual está dentro do limite aceitável por atender a condição 4,0≤d .

9.11 AMOSTRAGEM POR CONGLOMERADOS EM TRêS ES-TáGIOS

Seja uma população florestal dividida em N unidades de área denominadas primárias ou conglomerados de conglome-rados, tal que cada unidade primária ou conglomerado de con-glomerados é subdividida em M unidades denominadas secun-dárias ou conglomerados e cada unidade secundária ou con-glomerados é divida em U unidades denominadas terciárias ou subparcelas. Denomina-se amostragem em três estágios por-que a amostra é selecionada em três etapas. A primeira etapa

340


consiste em selecionar n unidades primárias dentre as N unida-des primárias. A segunda consiste em selecionar m unidades secundárias dentre as M unidades secundárias. Na terceira eta-pa selecionam-se u unidades terciárias dentre as U unidades terciárias existentes.

Em florestas tropicais, quando a acessibilidade é difícil, é vantajosa a aplicação da amostragem por conglomerados. Em in-ventários realizados em áreas de difícil acesso, em que o custo de localização da unidade de amostra é alto, o uso da amostragem em três estágios possibilita a redução do custo do levantamento.

As n unidades primárias serão denominadas de conglome-rados de conglomerados, pois em cada unidade primária ter-se-á m conglomerados. As m unidades secundárias serão denomi-nadas de conglomerado, pois ter-se-á apenas um conglomerado em cada unidade secundária. As u unidades terciárias serão de-nominadas de subparcelas dentro de cada conglomerado.

O confronto das variações entre os conglomerados de con-glomerados, entre conglomerados dentro dos conglomerados de conglomerados e entre subparcelas dentro dos conglomerados é que revelará a eficiência, em termos de precisão estatística, da aplicação da amostragem por conglomerados em três estágios. A amostra por conglomerados em três estágios será tanto mais precisa quanto maior for o componente de variância entre os conglomerados dentro dos conglomerados de conglomerados e entre as subparcelas dentro dos conglomerados e menor for o componente entre os conglomerados de conglomerados.

Considerando que os conglomerados de conglomerados (unidades primárias), os conglomerados (unidades secundárias) dentro dos conglomerados de conglomerados e as subparcelas (unidades terciárias) dentro dos conglomerados estão dispostas sistematicamente, a tendência no cálculo do erro padrão pode

341


ser considerada desprezível no caso de inventários florestais, pois, normalmente, os valores das variáveis respostas são orde-nados por algum critério objetivo, ou seja, sucedem-se em uma ordem obedecendo às leis da natureza florestal, podendo-se através da análise de variância ter uma aproximação satisfatória da estimativa da variância da população.


Sem perda de generalidade, será apresentado o caso mais simples, quando uma amostra de n conglomerados de conglo-merados selecionados de um total de N contém o mesmo nú-mero m de conglomerados, assim como todos m conglomera-dos selecionados de um total de M terão o mesmo número u de subparcelas de um total U.

Para formular os parâmetros populacionais e os respecti-vos estimadores, utilizar-se-á a seguinte notação.

N = número total de conglomerados de conglomerados ou unidades primárias, possível de ser alocado na área florestal a ser inventariada, respeitando-se a sua forma estrutural;

M = número total de unidades secundárias ou conglome-rados, possível de ser alocado dentro de cada unidade primária ou conglomerados de conglomerados;

U = número total de unidades terciárias ou subparcelas do conglomerado, possível de ser alocado dentro de cada unidade secundária ou conglomerado;

n = número de unidades primárias ou conglomerados de conglomerados amostrado;

m = número de unidades secundárias ou conglomerados amostrado dentro de cada unidade primária ou conglomerados de conglomerados;

342


u = número de unidades terciárias ou subparcelas amos-trado dentro de cada conglomerado;

ijky = valor da variável resposta correspondente à k-ésima subparcela do j-ésimo conglomerado, o qual pertence ao i-ésimo conglomerado de conglomerados.

a) valores médios por unidade terciária ou subparcela

a1) valores médios populacionais por unidade terciária ou subparcela

a2) valores médios amostrais por subparcela ou unidade de terceiro estágio

b) valor total b1) valor total populacional

YNMUY =

b2) valor total estimado

yNMUY =ˆ

;1 1 1

NMU

y

Y

N

i

M

j

U

k

ijk��

� ;1 1

MU

y

Y

M

j

U

k

ijk

i

��

�U

y

Y

U

k

ijk

ij

�� 1

;1 1 1

nmu

y

y

n

i

m

j

u

kijk��

� � �� ;

1 1

mu

y

y

m

j

u

k

ijk

i

��

�u

y

y

u

k

ijk

ij

��

�1

343


c) variância populacional por subparcela e seu estimador

;1

)(

)( 1 1 1

2

−

−=∑∑∑

= = =

NMU

Yy

yV

N

i

M

j

U

kijk

1

)(

)(ˆ 1 1 1

2

−

−=∑∑∑

= = =

nmu

yy

yV

n

i

m

j

u

kijk

9.11.2 parâmetros populacionais e seus estimadores atra-vés da análise de variância

a) variância a partir dos componentes de variância

A variância populacional e seu estimador, a partir dos com-ponentes de variância, são obtidos respectivamente pelas ex-pressões:

1

)()1()()1()()(

�

��

NMU

yVNMUyVNMUyVyV C CC

d d

1

)(ˆ)1()(ˆ)1()(ˆ)(ˆ

�

��

��

nmu

yVnmuyVnmuyVyV CCC

dd

Seja a verificação pela análise de variância considerando o esquema para ensaios em classificação hierárquica (Tabelas 9.26 e 9.27):

ijkijiijk ecccYy ��

Y é a média geral fixa, onde YYE =)( e 22 )( YYE =

ijky é o valor da variável resposta correspondente à k-ésima subparcela dentro do j-ésimo conglomerado dentro do i-ésimo conglomerados de conglomerados;

cci: com ni ,,2,1 L= é o efeito dos conglomerados dos conglo-merados (unidades primárias), tal que E(cci) = 0 e E(cci

2) = Vcc (y);cij: com mj ,,2,1 L= é o efeito do conglomerado j dentro do

conglomerado de conglomerado i, quando E(cij) = 0 e E(cij2) = Vc (y);

ijke : uk ,,2,1 L= é o efeito da subunidade k dentro do con-

344


glomerado j, dentro do conglomerado de conglomerados i, ou erro aleatório para 0)( =ijkeE e E(e2 ) = Vdd (y).

tabela 9.26 - Análise de variância em classificação hierárquica.

Causas de Variação G.L. SQ QMEntre conglomerados de conglomerados

1−n�

�

�n

i

i yyum1

2)( 11

�

�

n

SQV CC

Entre conglomerados dentro dos conglomerados de conglomerados

)1( −mn��

� �

�n

i

m

j

iij yyu1 1

2)()1(

.

2�

�

mn

SQV

CCdC

Entre subunidades dentro dos conglomerados dentro dos conglomerados de conglomerados

)1( �unm ∑∑∑= = =

−n

i

m

j

u

kijijk yy

1 1 1

2)(

Total 1−nmu ∑∑∑= = =

−n

i

m

j

u

kijk yy

1 1 1

2)(1

4

�

�

nmu

SQV Total

��

��n

i

m

j

u

k

ijkTotal CySQ1 1 1

2

nmu

y

C

n

i

m

j

u

k

ijk��

�1 1 1

2)(

��

��

n

i

iCC Cyju

SQ1

2..

1

� ��

��n

i

n

i

iijCCdC yju

yu

SQ1

2

..

2

..

11

� ��

��

n

i

n

i

m

j

ij

m

j

u

k

ijkCCdCdSub yu

ySQ1 1

2

.

1 1

2

..

1

345


tabela 9.27 - Componentes de variância.

Causas de Variação G.L. QM E(QM) FEntre conglomerados deconglomerados

1−N 1V )()()( yMUVyUVyV CCCdd ��

2

1

V

V

Entre conglomerados dentro dos conglomerados de conglomerados

)1( −MN 2V )()( yUVyV Cdd �3

2

V

V

Entre subunidadesdentro dos conglomerados dentro dos conglomerados de conglomerados

)1( �UNM 3V )(yVdd

Total 1−NMU 4V1

)()1()()1()(

�

��

�

NMU

yVNMUyVNMUyV C CC

dd

O termo E(QM) significa esperança do quadrado médio. Tem-se:

VCC (y) é o componente de variância entre os conglomera-dos de conglomerados;

VC (y) é o componente de variância entre os conglomerados dentro dos conglomerados de conglomerados;

Vdd (y) é o componente de variância entre subparcelas den-tro dos conglomerados dentro dos conglomerados de conglome-rados.

Não obstante, considerando que a amostra por conglome-rados, geralmente, é aplicada às populações extensas, pode-se considerar que:

Então, se V (y) = QMTotal , tem-se que:

1)1()1( �� NMUNMUNMU

)()()()( yVyVyVyV ddCCC ��

346


Dado que:

1

)(

)(ˆ 1

2

1 1

−

−=∑∑∑

= = =

nmu

yy

yV

n

i

m

j

u

kijk

Então a variância estimada através da análise de variância,

será:

Substituindo-se os componentes de variância correspon-dentes e considerando a população infinita.

Tem-se:

Tal que:

b) desvio padrão a partir dos componentes de variância

b1) desvio padrão populacional a partir dos componentes de variância

b2) desvio padrão estimado considerando os componentes de variância

1

ˆ)1(ˆ)1(ˆ)1()(ˆ ...

�

��

�

nmu

MQunmMQmnMQnyV

CCdCdSubCCdCCC

1)1()1( �� nmunmunmu

)(ˆ)(ˆ)(ˆ)(ˆ yVyVyVyV ddCCC ��

,ˆˆ

)(ˆ 21

mu

VVyVC C

�

�,

ˆˆ)(ˆ 32

u

VVyVC

�

� CCdCdSubdd QMyV ..)(ˆ�

)()()()( yVyVyVyS ddCCC ��

)(ˆ)(ˆ)(ˆ)( yVyVyVys ddCCC ��

347


c) coeficiente de variação

c1) coeficiente de variação populacional

c2) coeficiente de variação estimado

100)(

%ˆ ×=y

ysVC

d) variância da média por subparcela (unidade terciária)

d1) variância da média populacional por subparcela (unida-de terciária)

Do modelo matemático de um levantamento em três está-gios ijkijii jk ecccy �� Y , tem-se:

Sendo:

100)(

% ��

Y

ySCV

)(1

)(1

)(1

)()( 2

3

2

2

1

11 1 1yV

nmu

fyV

nm

fyV

n

f

nmu

y

VyV

n

i

m

j

u

k

ijk�

��

��

��

��

1

)(

)(1

2

1�

�

�

��

N

yy

yV

N

i

i

)1(

)(

)(1 1

2

2�

�

�

��

MN

yy

yV

N

i

M

j

iij

)1(

)(

)(1 1 1

2

3�

�

�

��

UNM

yy

yV

N

i

M

j

U

k

ijijk

348


d2) variância da média estimada por subparcela unidade y

Se n conglomerados de conglomerados são selecionados ao acaso e se m conglomerados são também retirados aleato-riamente dentro dos conglomerados de conglomerados e u su-bunidades também são selecionadas aleatoriamente dentro dos conglomerados, tem-se que y é uma estimativa sem tendência de Y e sua variância é:

)(ˆ)1()(ˆ)1(

)(ˆ1)()(ˆ

3321

221

111 1 1 yV

nmu

fffyV

nm

ffyV

n

f

nmu

y

VyV

n

i

m

j

u

kijk −

+−

+−

==∑∑∑

= = =

Sendo:

;1

)()(ˆ 1

2

1 −

−=∑

=

n

yyyV

n

ii

;)1(

)(

)(ˆ 1 1

2

2 −

−=∑∑

= =

mn

yy

yV

n

i

m

jiij

Para populações infinitas, usando-se os componentes de variância, tem-se:

e) erro padrão

e1) erro padrão populacional

)()( yVyS =

)1(

)(

)(ˆ 1 1 1

2

3�

�

�

��

unm

yy

yV

n

i

m

j

u

k

ijijk

nmu

yV

nm

yV

n

yVyV ddCCC )(ˆ)(ˆ)(ˆ

)(ˆ ��

349


e2) erro padrão estimado )(ˆ)( yVys =

f) intervalo de confiança

f1) intervalo de confiança para a média populacional (Y )

)]()([22

ystyYystyP aa +≤≤− =1-a

f2) intervalo de confiança para o valor total populacional (Y)

)](ˆ)(ˆ[22

ysNMUtYYysNMUtYP aa +≤≤− =1-a

:)(ys valor na unidade de área da subparcela do conglo-merado

g) intensidade de amostragem e limite de erro

Seja )(ystE ×= a semiamplitude do intervalo de confiança. Definindo a semiamplitude do intervalo de confiança em percen-tagem da média, tem-se: E = LE ,yLEE ×= tal que LE é denominado Limite de Erro ou Margem de Erro.

Dado que yLEystE �� )( , conclui-se que:

y

ystLE

)(%

�

�

De )(ystE ×= , tem-se: ).(ˆ22 yVtE ×= ). Logo:

])(ˆ)(ˆ

)(ˆ[1 22

mu

yV

m

yVyVt

nE ddC

CC ��

])(ˆ)(ˆ

)(ˆ[2

2

mu

yV

m

yVyV

E

tn ddC

CC��

])(ˆ)(ˆ

)(ˆ[)( 2

2

mu

yV

m

yVyV

yLE

tn ddC

CC ��

�

�

))(ˆ)(ˆ

)(ˆ(2

2

2

mu

yV

m

yVyV

yn

tLE ddC

CC ��

100])(ˆ)(ˆ

)(ˆ[1

)(% ��

mu

yV

m

yVyV

ny

tLE ddC

CC

])(ˆ)(ˆ)(ˆ

[)(ˆ 222

nmu

yV

nm

yV

n

yVtyVtE d dCCC

��

350


h) dimensionamento da amostra considerando os custos

Seja C = c1n + c2nm + c3nmu a função custo linear mais simples, sendo:

C = custo de medição de campo do inventário florestal;nc1 = custo de penetração e implantação dos conglomera-

dos de conglomerados;c2nm = custo de penetração e implantação dos conglome-

rados;nmuc3 = custo de medição das subunidades.

Considerando grandes áreas (populações infinitas) pode-se tornar mínimo o custo, para:

])(ˆ)(ˆ

)(ˆ[2

2

mu

yV

m

yVyV

E

tn ddC

CC ��

Seja C = c1n + c2nm + c3nmu

Se 2

2

E

tK = , então ],

)(ˆ)(ˆ)(ˆ[

mu

yV

m

yVyVKn ddC

CC �� logo:

)]()(ˆ)(ˆ

)(ˆ[ 321 mucmccmu

yV

m

yVyVKC ddC

CC ��

])(ˆ)(ˆ

)(ˆ[1 22

mu

yV

m

yVyVt

nE ddC

CC ��

])(ˆ)(ˆ

)(ˆ[2

2

mu

yV

m

yVyV

E

tn ddC

CC��

])(ˆ)(ˆ

)(ˆ[)( 2

2

mu

yV

m

yVyV

yLE

tn ddC

CC ��

�

�

))(ˆ)(ˆ

)(ˆ(2

2

2

mu

yV

m

yVyV

yn

tLE ddC

CC ��

100])(ˆ)(ˆ

)(ˆ[1

)(% ��

mu

yV

m

yVyV

ny

tLE ddC

CC

])(ˆ)(ˆ)(ˆ

[)(ˆ 222

nmu

yV

nm

yV

n

yVtyVtE d dCCC

��

351


Obter Otim e Otiu que torne mínimo KCC =*

Para 0*

=∂m

C , implica:

Finalmente:

Como:

Então:

Para 0*

=∂u

C , implica:

)]()(ˆ)(ˆ

)(ˆ[ 321

* mucmccmu

yV

m

yVyVC ddC

CC ��

])(ˆ)(ˆ

)(ˆ[])(ˆ)(ˆ

)(ˆ[])(ˆ)(ˆ

)(ˆ[ 321

*

mu

yV

m

yVyVmuc

mu

yV

m

yVyVmc

mu

yV

m

yVyVcC ddC

C CddC

CCddC

CC ��

)](ˆ)(ˆ)(ˆ[])(ˆ

)(ˆ)(ˆ[])(ˆ)(ˆ

)(ˆ[ 321

* yVyVuyVmucu

yVyVyVmc

mu

yV

m

yVyVcC ddCC C

dd

CCC

ddC

CC ��

)(ˆ)(ˆ))(ˆ)(ˆ

( 32221

*

yVucyVcum

yV

m

yVc

m

CCCCC

ddC��

�

))((ˆ])(ˆ

)(ˆ[322

1 uccyVu

yVyV

m

cCC

d d

C

oti

��

))((ˆ

])(ˆ

)(ˆ[

32

1

uccyV

u

yVyVc

mCC

dd

C

oti�

�

�

)](ˆ)(ˆ)(ˆ[])(ˆ

)(ˆ)(ˆ[])(ˆ)(ˆ

)([ 321

*yVyVuyVmuc

u

yVyVyVmc

mu

yV

m

yVyVcC ddCCC

dd

CCC

ddC

CC ��

)]()(ˆ[])(ˆ

())(ˆ

[ 32221

*

yVyVmcu

yVc

mu

yVc

u

CCCC

dddd��

�

)](ˆ)(ˆ[)](ˆ)(ˆ[

132

1

2yVyVmcyVc

m

yVc

uCCCdd

dd

oti

��

)](ˆ)(ˆ[

))((ˆ

3

2

1

yVyVmc

cm

cyV

uCCC

dd

oti

�

�

�

352


Tomando-se as diferenciais de segunda ordem em relação a m e u, verifica-se por meio da matriz Hessiana que otiu e otim tornam mínima a variância ).(yV ).

exercício 9.12

Seja uma área florestal de 648.000 ha. Esta área foi dividi-da em N = 120 unidades primárias (UP) de 5.400 ha cada, das quais foram sorteados n = 9 conglomerados de conglomerados. Em cada unidade primária sorteada foram alocados m = 5 conglo-merados. A estrutura espacial de cada conglomerado apresenta uma forma cruzada, composta por quatro subparcelas retangu-lares de 10 m de largura por 250 m de comprimento. A distância de cada subunidade ao ponto central foi de 50 m. A variável res-posta definida é o volume total de madeira considerando todas as espécies com DAP ≥ 30 cm. Os dados correspondentes às 180 subparcelas ou unidades terciárias de 0,25 ha foram trans-formados por hectare e estão apresentados na Tabela 9.28.

353


tabela 9.28 - Dados aplicativos: amostragem em três estágios.

CC C SUBPARCELAS TOTAIS1 2 3 4

1 1 183,0 141,5 153,8 162,8 641,11 2 186,3 78,3 134,8 164,8 564,21 3 188,4 200,6 157,4 137,0 683,41 4 234,5 184,4 183,3 206,9 809,11 5 167,9 189,1 177,7 238,1 772,8

TOTAIS 960,1 793,9 807,0 909,6 3470,62 1 198,3 167,0 172,2 137,1 674,62 2 112,5 69,9 98,3 126,1 406,82 3 170,3 181,4 352,1 230,8 934,62 4 257,2 379,7 198,0 132,4 967,32 5 116,8 67,5 67,9 106,8 359,0

TOTAIS 855,1 865,5 888,5 733,2 3342,33 1 255,2 226,8 229,1 304,2 1015,33 2 230,6 257,2 224,1 231,3 943,23 3 293,1 217,1 288,0 202,2 1000,43 4 155,6 143,4 222,8 195,1 716,93 5 229,1 417,5 237,3 227,9 1111,8

TOTAIS 1163,6 1262,0 1201,3 1160,7 4787,64 1 218,8 104,5 154,8 226,6 704,74 2 199,7 195,3 256,9 255,2 907,14 3 118,7 186,8 217,6 152,5 675,64 4 175,5 86,4 151,8 201,4 615,14 5 143,2 217,2 197,6 199,1 757,1

TOTAIS 855,9 790,2 978,7 1034,8 3659,65 1 208,0 186,2 160,9 305,5 860,65 2 244,1 183,9 205,9 232,0 865,95 3 195,6 329,3 230,2 194,4 949,55 4 205,9 225,4 230,0 221,9 883,25 5 184,6 207,6 201,8 195,9 789,9

TOTAIS 1038,2 1132,4 1028,8 1149,7 4349,16 1 275,5 133,3 190,1 200,6 799,56 2 236,0 257,6 234,5 275,0 1003,16 3 120,6 164,1 173,4 151,1 609,26 4 232,3 173,2 176,2 227,0 808,76 5 247,0 223,7 162,6 127,2 760,5

TOTAIS 1111,4 951,9 936,8 980,9 3981,07 1 139,6 147,5 78,8 111,5 477,47 2 172,2 177,8 136,9 201,4 688,37 3 138,5 88,6 46,4 55,3 328,87 4 164,6 149,5 165,5 144,6 624,27 5 62,9 81,8 118,8 97,1 360,6

TOTAIS 677,8 645,2 546,4 609,9 2479,308 1 132,8 167,9 173,8 167,6 642,18 2 170,3 171,8 138,8 126,9 607,88 3 151,6 225,1 165,1 174,0 715,88 4 165,7 188,4 87,5 167,0 608,68 5 173,6 166,5 190,0 221,3 751,4

TOTAIS 794,0 919,7 755,2 856,8 3325,709 1 177,4 233,6 274,4 228,7 914,19 2 203,4 286,5 253,8 214,9 958,69 3 210,6 311,8 256,1 140,3 918,89 4 87,9 243,6 142,7 197,0 671,29 5 234,1 259,3 158,4 170,8 822,6

TOTAIS 913,4 1334,8 1085,4 951,7 4285,30Total Geral 8369,50 8695,60 8228,10 8387,30 33680,50

354


a) informações preliminares sobre a área inventariada

Área florestal = 648.000 ha;área de cada de unidade primária é igual a:

haha

N

florestalÁrea400.5

120

000.648��

Número total de unidades primárias:

120400.5

000.648 ��haha

UPdaÁreaflorestalÁrea

N

N = número de unidades primárias sorteado é igual a 9, que será denominado de número de conglomerados de conglo-merados. Então:

120

91 ==

N

nf

Considerando que cada conglomerado apresenta uma for-ma cruzada cruz de malta, composto por quatro subunidades retangulares de 10 m de largura por 250 m de comprimento e uma distância de cada subunidade ao ponto central de 50 m, conclui-se que cada conglomerado ocupa um quadrado de 600m de lado, ou seja, uma área de 36 ha.

Número total de unidades secundárias:

m = 5 é o número de unidades secundárias amostrado e que será denominado de número de conglomerados. Então:

150

52 ==

M

mf

Número total de unidades terciárias:

15036

400.5 ��ha

ha

USdaÁrea

UPdaAréaM

14425,0

36 ��ha

ha

UTdaÁrea

USdaAréaU

355


u = 4 é o número de unidades terciárias amostrado e que será denominado de número de subparcelas do conglomerado. Então:

144

43 ==

U

uf

b) valor médio amostral considerando todas as unidades terciárias ou subparcelas

c) valores médios amostrais por unidade terciária (subpar-cela) dentro dos conglomerados (unidades secundárias) (Tabela 9.29)

tabela 9.29 - Médias estimadas por subparcela dentro dos conglomerados.

MÉDIAS ESTIMADAS ( uyyu

kijkij ∑

=

=1

)

CC (UP)ni ,,1 L=

CONGLOMERADOS ( mj ,,1 L= )

1 2 3 4 5

1 160,28 141,05 170,85 202,28 193,20

2 168,65 101,70 233,65 241,83 89,75

3 253,83 235,80 250,10 179,22 277,95

4 176,18 226,78 168,90 153,78 189,28

5 215,15 216,48 237,38 220,80 197,48

6 199,88 250,78 152,30 202,18 190,13

7 119,35 172,08 82,00 156,05 90,15

8 160,53 151,95 178,95 152,15 187,85

9 228,53 239,65 229,70 167,80 205,65

hamnmu

y

y

n

i

m

j

u

k

ijk

/1139,187459

5,33680 31 1 1�

��

��

356


d) valores médios amostrais por unidade terciária (subpar-cela) dentro dos conglomerados de conglomerados (unidades primárias) (Tabela 9.30)

tabela 9.30 - Valores médios por unidade terciária dentro dos conglomerados de conglomerados.

CC 1 2 3 4 5

muyym

j

u

k

ijki ��

�1 1

173,53 167,12 239,38 182,98 217,46

6 7 8 9

199,05 123,97 166,29 214,27

e) valor total estimado

f) variância estimada por subparcela

1

)(

1

)(

)(ˆ 1 1

1 1 1

2

1

2

1 1 1

2

�

�

��

�

�

��

��

� � �

��

nmu

nmu

y

y

nmu

yy

yV

n

i

m

j

n

i

m

j

u

k

ijku

k

ijk

n

i

m

j

u

k

ijk

1710,3628179

180

)5,680.33(95,531.951.6

)(ˆ

2

�

�

�yV

32,807.249.1211139,187000.648/ˆ mhayhaemÁreaY ��

357


g) variância estimada por meio da análise de variância do ensaio com classificação hierárquica

A partir dos resultados obtidos da análise de variância do ensaio com classificação hierárquica (Tabela 9.31) é calculado o valor da variância estimada do valor médio.

358


tabela 9.31 - Análise de variância: ensaios com classificação hierárquica.

Causas de Variação G.L. SQ QM F

Entre conglomerados deconglomerados

8 191.103,4875 23.887,9359 4,51

Entre conglomerados dentrodos conglomerados deconglomerados

36 190.499,6750 5.291,6576 2,67

Entre subunidades dentro deconglomerados dentro deconglomerados deconglomerados

135 267.839,45 1983,9959

Total 179 649.442,6153 3.628,1710

1

ˆ)1(ˆ)1(ˆ)1()(ˆ

...

�

��

�

nm

MQunmMQmnMQnyV

CCdCdSubCCdCCC

1459

9959,1983)14(596576,5291)15(99359,887.23)19()(ˆ

��

��yV

23)/(1710,628.3)(ˆ hamyV �

Componentes de variância:

h) desvio padrão estimado

hamyVyVyVysddCCC

/1615,617252,3740)(ˆ)(ˆ)(ˆ)( 3��

359


i) coeficiente de variação estimado

j) variância da média de y (população infinita usando os

componentes de variância)

k) erro padrão estimado l) intervalo de confiança para a média populacional (Y )P )]()([ ystyYystyP ×+≤≤×− )] =1-a

Limite inferior para o valor médiohamysty /3999345,14117642684,1196,13057311,163)(

3�� 163,3057311 – 1,96 x 11,17642684 = 141,3999345 m3 / ha

Limite superior para o valor médio

m) intervalo de confiança para o valor total populacional (Y)Limite inferior para o valor total

Limite superior para o valor total

%69,321001139,187

1615,61100

)(%ˆ ��

y

ysVC

nmu

yV

nm

yV

n

yVyV

ddCCC )(ˆ)(ˆ)(ˆ)(ˆ

��

7107,132459

9959,1983

59

9154,826

9

8139,929)(ˆ �

��

�

�

��yV

hamyVys /17642684,11912517,124)(ˆ)(3��

hamysty /2115277,18517642684,1196,13057311,163)(3

��

96,1025,0;135);1( 2��

�tt unm �

hamhayLIhaemÁrea 000.648/56,157.627.913999345,141000.648)/(3

��

hamhayLShaemÁrea 000.648/070.017.1202115277,185000.648)/(3

��

360


n) limite de erro para inventário florestal

o) variância da média de y (população finita)

Se n conglomerados de conglomerados são selecionados ao acaso e se m conglomerados são também retirados alea-toriamente de dentro dos conglomerados de conglomerados selecionados e u subunidades também são selecionadas ale-atoriamente dentro dos conglomerados, tem-se que y é uma estimativa sem tendência de Y e sua variância é:

)(ˆ)1()(ˆ)1(

)(ˆ1)()(ˆ

3321

221

111 1 1 yV

nmu

fffyV

nm

ffyV

n

f

nmu

y

VyV

n

i

m

j

u

kijk −

+−

+−

==∑∑∑

= = =

Sendo:

)(ystE ��

hamE /9057966,2117642684,1196,13

��

LE %= %41397908,133057311,163

90579661,21100

)(��

�

y

yst

361


Dado que

;120

91 ==

N

nf

;

1505

2 ==M

mf

144

43 ==

U

uf :

p) dimensionamento da amostra considerando os conglo-merados de conglomerados

Suponha que o limite de erro estipulado seja de 10% (LE =

0,10). O resultado da análise mostrou que para nove conglome-rados de conglomerados o limite de erro foi de 13,41%. Então, deve-se calcular o número de conglomerados de conglomerados para atender ao limite de erro (LE) igual a 0,10 e, posteriormente, o número de conglomerados de conglomerados faltantes.

Dado que E = LE yLEE ×= , então E = 0,10 x 163,3057311 = 16,33057311

Considerando que são necessários 18 conglomerados de conglomerados para atender ao limite de erro de 10%, deve-se retornar à floresta e medir mais nove, visto que já foram medidos nove.

)(ˆ459

)144

41(

150

5

120

9

)(ˆ59

)150

51(

120

9

)(ˆ9

120

91

)(ˆ321 yVyVyVyV

��

��

�

�

�

�

�

�

)(ˆ459

)560024305555,0)(ˆ

59

0725,0)(ˆ

9

925,0)(ˆ

321 yVyVyVyV��

�

�

��

9959,1983459

)560024305555,02144,1322

59

0725,03387,1194

9

925,0)(ˆ

�

��

��

�

��yV

0268,01302,27515,122)(ˆ ��yV

)/(9085,124)(ˆ 3hamyV �

362


q) números de conglomerados e de subparcelas ideais

Supondo: C1 = R$12.000,00, C2 = R$1500,00 e C3 = R$250,00. Então:

C1 / C2 = 8 e C2 / C3 = 6

Considerando a população como infinita:

)4

6(8139,929

)4

9959,1.9839154,826(8

))((ˆ

])(ˆ

)(ˆ[

22

2

32

1

��

�

�

�

�

�

CC

C

uccyV

u

yVyVc

m

CC

dd

C

oti

61,21549,689833

3232,10.581

))((ˆ

])(ˆ

)(ˆ[

32

1

��

�

�

�

uccyV

u

yVyVc

m

CC

dd

C

oti

)9154,8268139,9295(6

)5

8(9959,1.983

)](ˆ)(ˆ[

))((ˆ

2

2

2

3

2

1

��

�

�

�

�

�

C

CC

yVyVmc

cm

cyV

u

CCC

dd

oti

38,2912,66415

5.158,38934

)](ˆ)(ˆ[

))((ˆ

3

2

1

��

�

�

�

yVyVmc

cm

cyV

uCC C

dd

o ti

Esses resultados recomendam que a estrutura ótima deva ter a unidade primária ou conglomerados de conglomerados composta por três conglomerados e cada conglomerado con-gregando três subparcelas.

cApítulo 10

InventárIo FlorestAl contínuo

Apresenta metodologias sobre a aplicação das técnicas de análise univariada com parcelas subdivididas (Split-Plot) e de amostragem com substituição parcial (Sampling with Partial Re-placement), em levantamentos com medidas repetidas no tempo visando avaliar o caráter dinâmico do crescimento de uma flo-resta. Mostra como analisar as tendências de crescimento pelo método dos polinômios ortogonais explicando a decomposição da soma de quadrados dos correspondentes efeitos polinomiais ortogonais em: efeito linear, quadrático, etc. Mostra exemplos aplicativos sobre todos os temas abordados.

365

Inventário florestal contínuo

Para avaliar o caráter dinâmico do crescimento de uma floresta, por exemplo, após uma intervenção exploratória dos recursos madeireiros, faz-se necessário proceder ao monitora-mento, o qual é definido como o instrumento de avaliação do processo de evolução e de recomposição das características qualitativas e quantitativas da floresta. Na ciência florestal, este procedimento é conhecido como Inventário Florestal Contínuo, que corresponde a efetuar medições repetidas vezes no tempo, ou seja, medições em várias ocasiões. Os sucessivos inventá-rios florestais permitirão definir os intervalos ideais de colheita dos produtos da floresta sob manejo sustentável.

Por outro lado, quando se procede às medições nas mes-mas unidades de amostra, sucessivamente, em várias ocasiões, evidentemente existirão correlações entre as ocasiões, as quais devem ser consideradas nas análises estatísticas.

De acordo com o tipo de alocação das unidades de amos-tra na população, a amostragem em múltiplas ocasiões pode ser classificada em três maneiras distintas:

a) amostras independentes (parcelas temporárias)

Neste caso, as amostras mensuradas nas diversas ocasi-ões são analisadas independentemente umas das outras, sendo as unidades das amostras medidas definidas como temporárias;

b) amostras dependentes (parcelas permanentes)

Constitui-se em um problema de população multivariada, onde as variáveis aleatórias, por exemplo, volume de madeira em p-ocasiões, seguem uma distribuição de probabilidade com vetor de médias ],,,[ 21

'pv YYYY L= e matriz de covariâncias ∑ . A matriz

366


de covariâncias é uma matriz simétrica que contém na diagonal principal as variâncias para cada uma das ocasiões e as covariân-cias das ocasiões combinadas aos pares fora da diagonal.

��

�

�

��

�

�

��

)()()(

)()()(

)()()(

21

22221

11211

yVyVyV

yVyVyV

yVyVyV

pppp

p

p

��

��

O inventário florestal contínuo com parcelas permanentes, em termos da análise estatística, enquadra-se no grupo de expe-rimentos com medidas repetidas, mais precisamente na classe dos levantamentos longitudinais. Neste livro, considera-se que cada unidade de amostra recebe um único tratamento e sucessi-vamente no tempo mensuram-se as respostas correspondentes, tendo-se como objetivo o estudo de curvas de crescimento e análise de perfil.

Existem dois métodos com o propósito de testar as hipó-teses sobre o efeito dos tratamentos e a correspondente varia-ção ao longo do tempo. O primeiro adota um procedimento uni-variado, tratando as observações medidas no tempo como se fossem originadas de subdivisões das unidades experimentais (split-plot), sendo estudado através do delineamento em parce-las subdivididas ou divididas. O segundo método, denominado de análise de perfil “profile analysis”, adota um procedimento multivariado, ou seja, considera as observações repetidas sobre cada unidade experimental como um vetor de respostas.

A aplicação da análise univariada (método de parcelas sub-divididas), em experimentos de medidas repetidas no tempo, so-mente é válida sob a pressuposição de uniformidade da matriz de covariâncias. A matriz uniforme ocorre quando as ocasiões

367


apresentarem homogeneidade de variâncias e forem igualmente correlacionadas ( ρ ).

=∑

1

1

1

)(

L

LLLL

L

L

ρρ

ρρρρ

yV

)(yV é a variância comum entre as unidades dentro das ocasiões e ρ é a correlação comum entre as ocasiões combi-nadas aos pares.

O procedimento adotado é selecionar e medir a amostra na primeira ocasião, tornando as unidades de amostra perma-nentes, sendo remedidas nas ocasiões restantes. Neste proce-dimento, ocorrerão correlações entre as medições nas diversas ocasiões, e que em termos da ciência florestal são importantes para a interpretação do comportamento dos parâmetros envolvi-dos na recomposição da floresta;

c) amostras mistas

Neste caso a amostra do inventário contínuo consiste em estabelecer, conjuntamente, parcelas permanentes e temporá-rias. No item 10.2 será visto o procedimento com amostra mista denominado de Amostragem com Substituição Parcial (ASP), o qual apresenta uma grande importância na área de inventário florestal.

10.1 MÉTODO DE ANáLISE DE PARCELAS SUBDIVIDIDAS

Seja um experimento com o delineamento inteiramente ao acaso, em que m métodos silviculturais são aplicados em

368


n unidades experimentais, de modo que jn seja o número de parcelas submetidas ao j-ésimo tratamento ( mj ,,2,1 L= ) e as observações sejam feitas, periodicamente, em p ocasiões dis-tintas ( pk ,,2,1 L= ).

∑=

=m

jjnn

1

Seja ijkjkkjijk etooty �� o modelo matemático, onde ijky é a medida efetuada na i-ésima unidade de amostra de tamanho jn ( jni ,,2,1 L= ), submetida ao j-ésimo tratamento, e correspondente à k-ésima ocasião ( pk ,,2,1 L= ); jt é o efeito de tratamentos, ko é o efeito de ocasiões,

ijkjkkjijk etooty �� é o efeito de inte-ração entre tratamentos e ocasiões.

São considerados fixos os efeitos dos tratamentos, das oca-siões e da interação entre ocasiões e tratamentos e que a va-riável ijke seja normalmente distribuída. O modelo em parcelas subdivididas pressupõe que o desvio aleatório ijke é decomposto em duas fontes independentes de erros: )( jia e

)()( jikjkkjijijk btooaty �� , sendo )( jia o componente referente à diferença individual da i-ésima unidade dentro do j-ésimo tratamento e

)()( jikjkkjijijk btooaty �� o componente do erro refe-rente à medida efetuada sobre a unidade i submetida ao trata-mento j na ocasião k. Assim, o modelo apresenta a equação:

)()( jikjkkjijijk btooaty ��

Verifica-se que os tratamentos são aplicados sobre cada unidade experimental, enquanto que as ocasiões são considera-das como subdivisões dessas unidades. Nesse caso, os efeitos principais de tratamentos são calculados sobre os totais de uni-dades, e os efeitos da interação tratamentos × ocasiões a partir das diferenças entre observações dentro das unidades.

As somas de quadrados, pressupondo normalidade dos

369


erros, apresentam distribuição 2c e são mutuamente indepen-dentes.

A Tabela 10.1 apresenta a análise de variância usual para experimentos inteiramente ao acaso com tratamentos em parce-las subdivididas. A presença ou ausência de interação entre trata-mentos e ocasiões definirá o procedimento adequado para esta-belecer os testes de comparações múltiplas. O procedimento de ajustamento de curvas depende da ausência ou presença de inte-ração tratamento x ocasião. No caso da interação ser significativa, implica que os tratamentos se comportam de forma diferente em relação às ocasiões. Porém, se não existir interação significa que os tratamentos, no tempo, apresentam a mesma tendência.

Seja uma área florestal submetida a m tratamentos de manejo, onde foi realizado um inventário florestal contínuo com uma amostragem simples ao acaso de n unidades de amostra considerando p ocasiões distintas, tal que .21 mnnnn +++= L

tabela 10.1 - Análise de variância: delineamento inteiramente ao acaso de parcelas divididas.

C. variação G.L. S.Q. Q.M.

Tratamentos(Trat) 1�m �

�

��m

j

j

jnp

yy

npSQ

1

2

...2

..1

11

1

11

��

m

SQQM

Erro (a) mn � � ��

��m

j

m

j

j

j

n

i

ij Ynp

yp

SQj

1 1

2

..

1

2

.2

111

mn

SQQM

�� 2

2

Ocasiões(Oca)

1�p ��

��

p

k

knp

yy

nSQ

1

2

...2

..3

113

3�

�p

SQQM

Trat � Oca )1)(1( �� mp 31

1 1

2

...2

.4

1SQSQ

np

yy

nSQ

m

j

p

k

jk

j

��

)1)(1(

44

��

mp

SQQM

Erro(b) ))(1( mnp ��432165

SQSQSQSQSQSQ ��))(1(

55

mnp

SQQM

��

Total 1�np ��

��j

n

i

m

j

p

k

ijknp

yySQ

1 1 1

2

...2

6

370


Normalmente, em experimentos com parcelas divididas, o interesse é testar as seguintes hipóteses:

H01: Não existência de efeito diferencial de tratamentosH01: tj = 0 (j = l, • • • , m)

2

1

1

QM

QMF �

H02: Não existência de efeito diferencial de ocasiõesH02: ok = 0 (k = l, • • • , p)

5

3

2QM

QMF �

H03: Não existência de efeito de interação entre tratamen-tos e ocasiões

H03: tojk = 0 [( j = l, • • • , m); (k = 1, • • • , p)]

5

4

3QM

QMF �

Se H03 denota que o efeito da interação é não significativo, resulta que todos os tratamentos apresentam a mesma tendên-cia de crescimento. No entanto, se o efeito da interação é signifi-cativo verifica-se que pelo menos um tratamento apresenta uma tendência diferente.

A natureza da tendência é estudada através de curvas apropriadas. Tratar-se-á, no exemplo a seguir, do ajustamento de curvas polinomiais.

371


exercício 10.1

Seja o ensaio instalado em 1980 por Yared (1983), na Esta-ção Experimental do Centro de Pesquisas Agroflorestal da Ama-zônia Oriental - CPATU, da Empresa Brasileira de Pesquisas Agropecuária - EMBRAPA, no município de Belterra, estado do Pará, e apresentado em Queiroz (1993b). Os dados da Tabe-la 10.2 referem-se aos incrementos em altura (metros) de qua-tro procedências de Cordia alliodora: (9/77: Honduras), (10/77: Guatemala), (20/77: San Francisco – Honduras) e (19/77: Finca-la Fortuna – Honduras). No ensaio foi usado o delineamento em blocos ao acaso com 5 repetições e mensurado aos 6, 12, 18, 24 e 30 meses. A Tabela 10.3 apresenta a estrutura da análise de variância de parcelas divididas em blocos ao acaso. A Tabela 10.4 mostra os valores totais das combinações Proc × Oca.

372


tabela 10.2 - Incrementos em altura (metros) das quatro procedências (Proc).

Proc. Meses(Oca)

BlocosMédia

I II III IV V Total

9/77 612182430

0,590,510,240,540,35

0,370,490,780,690,44

0,520,420,450,310,18

0,520,370,410,500,11

0,440,400,310,360,21

2,442,192,192,401,29

0,490,440,440,480,26

Total - 2,23 2,77 1,88 1,91 1,72 10,51 -

10/77 612182430

0,680,740,650,380,48

0,550,360,510,390,20

0,590,460,630,310,06

0,580,420,310,240,21

0,600,430,520,400,19

3,002,412,621,721,14

0,600,480,520,340,23

Total - 2,93 2,01 2,05 1,76 2,14 10,89 -

20/77 612182430

0,630,901,110,960,60

0,581,051,140,850,40

0,690,871,121,020,59

0,500,710,980,650,62

0,490,781,040,910,40

2,894,315,394,392,61

0,580,861,000,880,52

Total - 4,20 4,02 4,29 3,46 3,62 19,59 -

19/77 612182430

0,650,790,790,790,61

0,580,690,870,770,51

0,440,770,730,690,25

0,540,810,720,350,41

0,260,230,540,530,49

2,473,293,653,132,27

0,490,660,730,630,45

Total - 3,63 3,42 2,88 2,83 2,05 14,81 -

Total geral

- 12,88 12,22 11,10 9,96 9,53 55,80 -

373


tabela 10.3 - A análise de variância de parcelas divididas em blocos ao aca-so.

Variação G.L. S.Q. Q.M.

Blocos r - 1

rmp

y

mp

y

SQ

r

ii

Blo

2

...1

2

..

cos��

�� 1

co s

cos

�

�

r

SQQM Blo

Blo

Procedências m - 1

rmp

y

rp

y

SQ

m

j

j

oc

2

...1

2

..

Pr��

�� 1

Pr

Pr

�

�

m

SQQM

oc

oc

Erro (a) (r - 1)(m - 1)

ocBlo

r

i

m

j

i j

aErro

SQSQ

rmp

y

p

y

SQ

Prcos

2...1 1

2.

)(

��

��

�� )1)(1(

)(

)(��

�

mr

SQQM

aErro

aErro

Ocasiões p - 1

rmp

y

rm

y

SQ

p

kk

Oca

2

...1

2

..

��

�� 1�

�

p

SQQM

Oca

Oca

Proc×Oca (m - 1)(p - 1)

Ocaoc

m

j

p

kjk

Ocaoc

SQSQ

rmp

y

r

y

SQ

��

��

��

�

Pr

2

...1 1

2

.

Pr

Proc

Proc

Erro (b) m(r - 1)(p - 1)Ocao cOcaaErro

ocBloTotalbErro

SQSQSQ

SQSQSQSQ

��

��

Pr)(

Prco s)(

)1(1(

)(

)(��

�

prm

SQQM

bErro

bErro

Total rmp - 1��

� � �

��jn

i

m

j

p

kijkTotal

rmp

yySQ

1 1 1

2

...2

374


tabela 10.4 - Valores totais das combinações: Proc × Oca.

Ocasiões(meses)

Procedências Total

9/77 10/77 20/77 19/77

612182430

2,442,192,192,401,29

3,002,412,621,721,14

2,894,315,394,392,61

2,473,293,653,132,27

10,8012,2013,8511,64 7,31

Total 10,51 10,89 19,59 14,81 55,80

;4=m ;5=r 5=p

a) análise de variância preliminar

��

��r

i

m

j

p

k

ij k yy1 1 1

...80,55

7378,361 1 1

2��

� � �

r

i

m

j

p

k

ijky

1364,31554

80,5522

... ��

��rmp

yC

��

��r

i

iy1

222222

..3010,63153,996,910,1122,1299,12

��

��m

j

jy1

22222

..1564,83281,1459,1989,1051,10

951,16905,283,277,223,22222

1 1

2

.��

� �

�m

j

r

i

ijy

2282,64631,764,1185,132,128,1022222

1

2

..��

�

p

k

ky

162,17627,213,319,244,2 2222

1 1

2

.��

� �

�m

j

p

k

jky

375


Portanto:

6014,51364,317378,361 1 1

2��

� � �

r

i

m

j

p

k

ijkTotal CySQ

42865,01364,313010,63154

11

1

2

..cos ��

��

r

i

iBlo Cymp

SQ

149856,21364,311564,83255

11

1

2

..Pr ��

��

m

j

joc Cyrp

SQ

149856,242865,01364,315

951,1691

1

Prcos

1

2

.)(��

� �

n

i

ocBlo

m

j

ijaErroSQSQCy

pSQ

275294,0)( �aErroSQ

17501,11364,312282,64645

11

1

2

..��

��

�

Cyrm

SQp

k

kOca

17501,1149856,21364,31162,1765

11

1

Pr

1

2

.Pr��

� �

�

m

j

Ocaoc

p

k

jkOcaocSQSQCY

rSQ

771134,0Pr ��OcaocSQ

OcaocOcaaErroocbloTotalbErro SQSQSQSQSQSQSQ �� Pr)(Prcos)(

771134,017501,1275294,0149856,242865,06014,5)( ��bErroSQ

801456,0)( �bErroSQ

Na Tabela 10.5 estão apresentados os resultados da análi-se de variância preliminar.

tabela 10.5 - Resultados da análise de variância preliminar.

Causas de variação GL SQ QM F

BlocosProcedênciasResíduo (a)Ocasiões

Procedência x OcasiãoResíduo (b)

43

124

1264

0,42872,14990,27531,17500,77110,8015

0,10720,71660,02290,29370,06430,0125

31,29 **

23,50 ** 5,14 **

Total 99 5,6015 - -

;95,501,0;12;3

�F ;65,301,0;64;4

�F 50,201,0;64;12

�F

376


Se o efeito da interação fosse não significativo, então as procedências apresentariam a mesma tendência de crescimen-to em relação às ocasiões. No entanto, a análise de variância mostra que a interação procedência x ocasião é altamente sig-nificativa, o que demonstra que as procedências se comportam de maneira diferente em relação às ocasiões. Neste caso, se analisa as tendências através do ajustamento de curvas poli-nomiais às médias ou totais de observações para cada ocasião sobre cada procedência. O grau do polinômio para cada proce-dência é obtido pela decomposição da soma de quadrados dos correspondentes efeitos polinomiais ortogonais em: efeito linear, quadrático, etc., até o grau .1−p

Analisando-se as tendências através de curvas polino-miais, deve-se desdobrar a variação de ocasiões e a interação procedência x ocasião, nos componentes: ocasiões dentro da procedência 9/77, ocasiões dentro da procedência 10/77, oca-siões dentro da procedência 20/77, ocasiões dentro da proce-dência 19/77, onde cada componente terá 4 graus de liberdade, sendo então desdobrados nos efeitos: linear, quadrático, cúbico e quarto grau. Neste exemplo, de acordo com Gomes (2000), como se têm cinco ocasiões igualmente espaçadas, os coefi-cientes dos polinômios ortogonais são os mostrados na Tabela 10.6. A Tabela 7 do Anexo apresenta os coeficientes para inter-polação de polinômios ortogonais até onze ocasiões.

377


tabela 10.6 - Coeficientes dos polinômios ortogonais.

Ocasiões (p = 5)Total Tratamento

1° Grau (c1) 2° Grau (c2) 3° Grau (c3) 4° Grau (c4)

-2-10

+1+2

+2-1-2-1

+2

-1+20-2

+1

+1-4

+6-4

+1

10,8012,2013,8511,64 7,31

Da teoria dos polinômios ortogonais, têm-se as seguintes fór-

mulas para calcular a soma de quadrados para cada componente:

;

)(

1

2

1

rK

TC

SQ

p

i

i1i

Linear

�� ;

)(

2

1

2

rK

TC

SQ

p

i

i2i

Quadrático

��

�

;

)(

3

1

2

rK

TC

SQ

p

i

i3i

Cúbico

��

4

1

2

4

)(

0

rK

TC

SQ

p

i

i4i

grau

��

C1, C

2, C

3, C

4 representam os coeficientes dos polinômios

ortogonais;iT = reporta os totais dos tratamentos nas p ocasiões;

K1, K

2, K

3, K

4 são as somas de quadrados dos coeficientes

dos polinômios ortogonais.

b) análise de variância final

Para estudar o comportamento das ocasiões dentro de cada procedência é necessário desdobrar interação Proc x Oca.

De acordo com a Tabela 10.4, tem-se:

1) 175576,055

51,10

5

)29,140,219,219,244,2(77/9...

222222

�

�

��

�dOcaSQ

378


Desdobrando SQ . Oca.d.9/77 nos efeitos: linear, quadrático, cúbico e quarto grau:

O termo SQ . Oca.d.9/77 significa soma de quadrados do fator ocasião dentro do tratamento 9/77.

Note que:

00004321

77/9... SQSQSQSQdOcaSQ ��

570063431428,0049298,0032572857,0087362,000004321

�� SQSQSQSQ

175575999,00000 4321�� SQSQSQSQ

379


2) 442416,055

89,10

5

)14,172,162,241,200,3(77/10...

222222

�

�

��

�dOcaSQ

Desdobrando SQ . Oca.d.10/77 nos efeitos: linear, quadráti-co, cúbico e quarto grau:

Note que:

00004321

77/10. SQSQSQSQdOcaSQ ��

031873142,0004608,0016972857,0388962,00000 4321

�� SQSQSQSQ

442415999,077/10... �dOcaSQ

380


3) 062176,155

59,19

5

)61,239,439,531,489,2(77/20...

222222

�

�

��

�dOcaSQ


Note que:

00004321


026404571,0003872,0027291429,1004608,000004321

�� SQSQSQSQ

062176,177/20... 00004321

�� SQSQSQSQdOcaSQ

381


4)


Note que:

00004321


570026331428,0000288,0256822857,0006272,000004321

�� SQSQSQSQ

266015999,000004321

�� SQSQSQSQ

382


Observando que:SQ . Oca d.9 / 77 + SQ . Oca . d 10 / 77 + SQ . Oca . d . 20 / 77 + SQ . Oca . d . 19 / 77 = SQOca + SQProc x Oca Oc aocOca

SQSQdOcaSQdOcaSQdOcaSQdOcaSQ�

��Pr

77/19...77/20...77/10..77/9..

9461,1266016,0062176,1442416,0175576,0

77/19...77/20...77/10..77/9..

��

�� dOcaSQdOcaSQdOcaSQdOcaSQ

Sendo:SQOca + SQProc x Oca = 1,1750 + 0,7711 = 1,9461

A Tabela 10.7 apresenta o resultado da análise de variân-cia final.

tabela 10.7 - Análise de variância final.

Causas de variação GL SQ QM FBlocosProcedênciasResíduo (a)

43

12

0,42862,14000,2754

0,10710,71660,0229

- 31,29 **

-

Ocasiões d. Procedências (16) (1,9462) - -

Ocasiões d. Procedência 9/77Efeito linearEfeito quadráticoEfeito cúbicoEfeito de 40 grau

(4)1111

(0,1756)0,08740,03260,04930,0063

0,04390,08740,03260,04930,0063

-

- 6,99 *

2,613,940,50


(4)1111

(0,4424)0,38900,01700,00460,0319

0,11060,38900,01700,00460,0319

8,85 31,12 **

1,36 0,37 2,55


(4)1111

(1,0622)0,00461,02730,00390,0264

0,26550,00461,02730,00390,0264

21,240,37

82,18 **0,312,11


(4)1111

(0,2660)0,00630,25680,00030,0026

0,06650,00630,25680,00030,0026

5,320,50

20,64 **0,020,21

Resíduo (b) 64 0,8014 0,0125 -Total 99 5,6014 - -

* significativo ao nível de 95% de confiança** significativo ao nível de 99% de confiança

383


Os resultados da análise de variância mostrados na Ta-bela 10.7, demonstram que as procedências 9/77 e 10/77 possuem tendências lineares de crescimento do incremento

)(iii

ebXaY �� ; enquanto as tendências de crescimento do incremento das procedências 20/77 e 19/77 são descritas pelo modelo quadrático

iiecXbXaY ��

2 . A Figura 10.1 confirma esses resultados.

0

1

2

3

4

5

6

6 12 18 24 30

OCASIÕES (meses)

INC

RE

ME

NTO

EM

ALT

UR

A(m

)

T9/77

T10/77

T20/77

T19/77

Figura 10.1 - Tendências do crescimento do incremento em altura.

A Tabela 10.8 mostra as comparações dos valores médios dentro de cada ocasião, para as procedências que apresenta-ram as mesmas tendências, através do teste de “t” de Student, para tratamentos independentes (procedências).

384


tabela 10.8 - Comparação dos incrementos dentro de cada ocasião (Teste “t”).

Ocasiões Procedência 9/77 Procedência 10/77 Valor “t”

Médias Variâncias Médias Variâncias

612182430

0,48800,43800,43800,48000,2580

0,007170,003570,04340,02290,0180

0,60000,48200,52400,34400,2280

0,002350,022100,018300,004630,02360

-2,5668 *-0,6141 ns-0,7742 ns 1,8328 ns

Ocasiões Procedência 20/77 Procedência 19/77 Valor “t”

Médias Variâncias Médias Variâncias

612182430

0,57800,86201,07800,87800,5220

0,007270,016700,004420,020200,01250

0,49400,65800,73000,62600,4540

0,02290,05930,01490,03430,0181

1,0814 ns1,6547 ns5,5984 **2,4137 *0,8692 ns

3060,205,0;8 �t

3554,301,0;8 �t

Os resultados mostram diferença somente na primeira oca-sião (6 meses) entre os incrementos das procedências 9/77 e 10/77, concluindo-se pela não existência de coincidência nos perfis de crescimento.

Denota-se diferença entre as procedências 20/77 e 19/77 nas ocasiões 18 meses e 24 meses, concluindo-se pela não existência de coincidência nos perfis de crescimento.

10.2 MODELO DE AMOSTRAGEM COM SUBSTITUIçãO PAR-CIAL

A Amostragem com Substituição Parcial – ASP (“Sampling with Partial Replacement”) reporta-se ao problema da amostra-gem de uma população multidimensional. Para melhor enten-dimento, seja o caso de uma população bivariada, tal que as

385


variáveis aleatórias x e y possuem distribuição de probabilidade com vetor de médias vY desconhecido e matriz de covariâncias � conhecida.

Visando apresentar o desenvolvimento teórico da ASP, sejam três subamostras aleatórias com as dimensões k, m e n e estatisticamente independentes. O método consiste na me-dição da característica x, que representa o volume de madeira na primeira ocasião, somente nas unidades da subamostra de tamanho k. Na subamostra de tamanho m são medidas as ca-racterísticas x e y, sendo y o volume de madeira na segunda ocasião. Nas unidades da subamostra de dimensão n somente a característica y é medida.

Verifica-se que a subamostra de tamanho n, na verdade, pode ser interpretada como substitutiva da subamostra k e, por essa razão, essas subamostras são interpretadas como uma Amostra-gem com Substituição Parcial (ASP). Obviamente, o procedimento pode evoluir para três ou mais ocasiões. Informações mais deta-lhadas sobre a amostragem com substituição parcial podem ser encontradas em Cunia (1974) e em Cunia e Chevrou (1969).

10.2.1 estimador Asp de xµ e sua variância )ˆ( xV µ

Seja um levantamento florestal contínuo onde se deseja esti-mar os volumes médios de madeira em uma determinada ocasião ( x ) e em outra ocasião subsequente ( y ), bem como estimar o incremento médio em volume entre essas duas ocasiões ( xy − ).

Sejam as observações concernentes às subamostras de dimensões k, m e n, selecionadas inteiramente ao acaso e men-suradas para as características x e y, conforme o critério ASP.

nmkmkmkmkkkmkkkk yyyyyyxxxxxx ++++++++++++ ,...,,,,...,,,,...,,,,...,, 21212121

386


Seja xµ a forma geral do estimador linear e não tendencio-so da média aritmética :xµ

nmknmkmkmk

mkmkkkmkmkkkkkx

ycyc

ycycxaxaxaxa

++++++++

++++++++

+++++++++++=

L

LLL

11

111111µ

Sob o argumento de que x e y estão na mesma amostra e caracterizados pelo mesmo tratamento, pode-se formular ,ˆ xµ como:

nnmmmmkkx ycycxaxa +++=µ (10.1)

Por conseguinte:)()()()()ˆ( nnmmmmkkx yEcyEcxEaxEaE +++=µ

ynymkmkkx ccaaE µµµµµ +++=)ˆ(

ynmxmkx ccaaE µµµ )()()ˆ( +++=

Para que ,)ˆ( xxE µµ = então mk aa −= 1 e nm cc −= , tal que efetuando as substituições na Equação 10.1, obtém-se:

)()(ˆ mnnmkmkx yycxxax −+−−=µ (10.2)

Dado que k

xVxV k

)()( = e

m

xVxV m

)()( = , então:

m

xV

k

xVxxV mk

)()()( +=−

Pois os estimadores kx e mx são estatisticamente inde-pendentes.

Dado que ny e my são estatisticamente independentes, tem-se:

m

yV

n

yVyyV mn

)()()( +=−

387


Pois:;

)(),cov(

k

xVxxx mkk =− ;0),cov( =− mnk yyx

m

yxVyyxx mnmk

),(),cov( =−− .

Então a variância de xµ é dada pela expressão:

m

yxVca

k

xVa

nmyVc

mkxVa

k

xVV

nmmnmx

),(2

)(2)

11)(()

11)((

)()ˆ(

22��

m

yxVca

k

xVa

nmyVc

mkxVa

k

xVV

nmmnmx

),(2

)(2)

11)(()

11)((

)()ˆ(

22��

m

yxVca

k

xVa

nmyVc

mkxVa

k

xVV

nmmnmx

),(2

)(2)

11)(()

11)((

)()ˆ(

22��

m

yxVca

k

xVa

nmyVc

mkxVa

k

xVV

nmmnmx

),(2

)(2)

11)(()

11)((

)()ˆ(

22�� (10.3)

Diferenciando-se a Expressão 10.3 em relação aos coefi-cientes ma e nc e anulando as derivadas parciais, obtém-se o ponto crítico dado em 10.4 e 10.5.

0)]11

)((2),(

2[])(

2),(

2)11

)((2[)ˆ( ��nnmmnmx

dcnm

yVcm

yxVada

k

xV

m

yxVc

mkxVadV �

Logo:

��

��

�

��

��

0)11

)((2),(

2

0)(

2),(

2)11

)((2

nmyVc

m

yxVa

k

xV

m

yxVc

mkxVa

nm

nm

��

��

�

��

��

0)11

)((2),(

2

0)(

2),(

2)11

)((2

nmyVc

m

yxVa

k

xV

m

yxVc

mkxVa

nm

nm

��

��

�

��

��

0)11

)((2),(

2

0)(

2),(

2)11

)((2

nmyVc

m

yxVa

k

xV

m

yxVc

mkxVa

nm

nm

��

��

�

��

��

0)11

)((2),(

2

0)(

2),(

2)11

)((2

nmyVc

m

yxVa

k

xV

m

yxVc

mkxVa

nm

nm

Concluindo que:

2))((

)(

�knnmmk

nmma

m��

�� (10.4)

2))(( �knnmmk

mnBc

x y

n��

� (10.5)

Dado que:

;)(

),(

yV

yxVBxy � ;

)(

),(

xV

yxVByx � yxxy BB�

2�

388


Para verificar a natureza do ponto crítico pela matriz Hes-siana, seja a diferencial de segunda ordem de )ˆ( xV µ :

Escrevendo na forma matricial, resulta:

A expressão )ˆ(2xVd µ é uma função homogênea do tipo

Q(xv) = xvAx ,)( 'vvv AxxxQ = , tal que n

nv Rxxxx ∈= ),...,,( 21' e A = (aij) nnijaA ×= )( é uma

matriz real. A função )( vxQ é denominada forma quadrática e A é chamada de matriz da forma quadrática e denominada de ma-triz Hessiana, a qual possui seus elementos calculados no ponto crítico.

Uma forma quadrática é dita positiva definida somente se 0)( >vxQ , tal que n

v Rx ∈∀ e vvv xxQ 00)( =⇔= . Esta mesma definição vale para a matriz da forma quadrática A , devido à correspondência biunívoca entre a forma quadrática e a matriz da forma quadrática.

O próximo passo é verificar se a matriz Hessiana é positiva definida, e, assim, comprovar que ma e nc , obtidos, respectiva-mente, pelas Equações 10.4 e 10.5, tornam mínima ),ˆ( xV µ ).

m

yxVca

k

xVa

nmyVc

mkxVa

k

xVV nmmnmx

),(2

)(2)

11)(()

11)((

)()ˆ( 22

��m

yxVca

k

xVa

nmyVc

mkxVa

k

xVV nmmnmx

),(2

)(2)

11)(()

11)((

)()ˆ( 22

��m

yxVca

k

xVa

nmyVc

mkxVa

k

xVV nmmnmx

),(2

)(2)

11)(()

11)((

)()ˆ( 22

��m

yxVca

k

xVa

nmyVc

mkxVa

k

xVV nmmnmx

),(2

)(2)

11)(()

11)((

)()ˆ( 22

��

389


Seja H a matriz Hesssiana:

��

�

�

��

�

�

��

��

)11

)((2),(

2

),(2)

11)((2

nmyV

m

yxVm

yxV

mkxV

H

��

�

�

��

�

�

��

��

)11

)((2),(

2

),(2)

11)((2

nmyV

m

yxVm

yxV

mkxV

H

��

�

�

��

�

�

��

��

)11

)((2),(

2

),(2)

11)((2

nmyV

m

yxVm

yxV

mkxV

H

��

�

�

��

�

�

��

��

)11

)((2),(

2

),(2)

11)((2

nmyV

m

yxVm

yxV

mkxV

H

De acordo com Searle (1971) e Ware e Cunia (1962), den-tre outros autores, para que uma matriz 22× seja definida posi-tiva, o determinante e os elementos da diagonal principal devem ser positivos. Neste caso, resulta:

0)11

)((2 ��

mkxV e 0)

11)((2 ��

nmyV0)

11)((2 ��

mkxV e 0)

11)((2 ��

nmyV0)

11)((2 ��

mkxV e 0)

11)((2 ��

nmyV0)

11)((2 ��

mkxV e 0)

11)((2 ��

nmyV , faltando verificar se

[ ]Hdet é positivo.

Multiplicando pela quantidade sempre positiva ,)]()(4[)(

2 yVxVnkm o sinal do [ ]Hdet não se altera:

� � 0det])()(4

[ 22

2

�� knknkmmnmHyVxV

nkm

Como [ ] 0det >H , conclui-se que a matriz Hessiana é defi-nida positiva, logo, )ˆ( xV µ é mínima para os coeficientes ma e nc dados em 10.4 e 10.5.

Finalmente, substituindo ma e nc na equação de ),ˆ( xV µ ). Tem-se:

]))((

1[)(

)ˆ(2

2

�

��

knnmmk

mn

mk

xVV

x

��

��

10.2.2 estimador Asp de yµ e sua variância )ˆ( yV µ

O estimador ASP pode ser deduzido diretamente da fórmu-

390


la correspondente ao estimador xµ , pois o modelo matemático é simétrico com respeito às variáveis x e y, resultando:

)()(ˆ ''

mnnmkmy yycxxay ��

Utilizando os mesmos procedimentos usados para obter xµ , têm-se:

2

'

))(( �knnmmk

kmBa

y x

m��

��

2

'

))((

)(

�knnmmk

mkmcn

��

��

]))((

1[)(

)ˆ(2

2

�

��

knnmmk

km

nm

yVV y

��

��

10.2.3 covariância entre os estimadores Asp xµ e yµ

Dado:

)()(ˆ mnnmkmkx yycxxax −+−−=µ

)()(ˆ ''mnnmkmny yycxxay −+−−=µ

Então, pela definição de covariância:

)]}ˆ(ˆ)][ˆ(ˆ{[)ˆ,ˆ( yyxxyx EEECov ��

Desenvolvendo, resulta que:

2))((

),()ˆ,ˆ(

��

knnmmk

yxmVCov yx

��

391


10.2.4 estimador Asp de dµ e sua variância )ˆ( dV µ

Dado que:

mk

xmxk

mk

xx mk

mk

ii

mk ++

=+

=∑

+

=+

1

nm

ynym

nm

yy nm

nmk

kii

nm ++

=+

=∑

++

+=+

1

Como xnk xExExE µ=== )()()( e :)()()( ynm yEyEyE µ===

mk

xmxk

nm

ynymxyd mknm

mknm ++

−++

=−= ++

Resultando:

))((

),(2)()()(

nmmk

yxmV

nm

yV

mk

xVdV

��

�

�

�

�

�

Shiver e Border (1996), utilizando as definições e os ar-gumentos apresentados anteriormente para obter xµ e yµ , de-monstram que:

kdmdndmdd xbxbyaya )1()1(ˆ ��

2))((

)(

�knnmmk

mnBmkma

xy

d��

��

2))((

)(

�knnmmk

kmBnmmb

yx

d��

��

m

yxVba

k

xVb

m

xVb

n

yVa

m

yVaV ddddddd

),(2

)()1(

)()()1(

)()ˆ(

222��

392


exercício 10.2

Seja o exemplo citado em Queiroz (1983) de um inventário florestal realizado em duas ocasiões, através da amostragem com substituição parcial, tal que a medição da primeira ocasião ocor-reu em k + m = 40 unidades de amostra (Ua), enquanto a medição da segunda ocasião ocorreu em m + n = 30 unidades de amostra, sendo m = 20 o número de parcelas permanentes medidas nas duas ocasiões. A Tabela 10.9 apresenta os valores volumétricos. Neste exemplo, utilizar o valor t = 2,00 (Estatística “t” de Student).

tabela 10.9 - Volume (m3/ ha).

Ua x y UA x y

12345678910111213141516171819202122232425

5,6616,26 12,40 7,56 11,88 11,48 9,86 12,74 9,1812,14 9,64 11,08 7,6816,00 5,74 2,5211,04 8,90 9,1817,8810,0610,8210,56 7,48 8,94

- - - - - - - - - - - - - - - - - -- -

15,5515,9115,8114,4214,99

26272829303132333435363738394041424344454647484950

6,049,30

18,2012,4211,3813,929,40

15,668,20

10,3012,0412,0813,708,908,72

- - - - - - - - - -

13,8515,0719,7316,6416,1017,1615,2319,0514,8215,6816,8216,4417,3015,1115,2414,4515,6015,5018,5413,3215,5018,4115,5214,2616,50

Fonte: Queiroz (1983)

393


a) estimativas das médias e das variâncias não conside-rando a ASP

a1) estimativas para a primeira ocasião da subamostra de tamanho k

hamk

x

x

k

i

i

k/441,10

20

82,208 31 ��

��

23

2

2

1

1

2

)/(009788,1419

20

82,2084756,2446

1

)(

)(ˆ hamk

k

x

x

xV

k

i

ik

i

i

k�

�

��

�

�

��

�

�

23 )/(7004894,020

009788,14)(ˆ)(ˆ ham

k

xVxV

k

k��

a2) estimativas para a primeira ocasião da subamostra de tamanho m

hamm

x

x

mk

ki

i

m/906,10

20

12,218 31��

��

��

23

2

1

2

12

)/(3861937,819

20

12,2181544,2538

1

)(

)(ˆ hamm

m

x

x

xV

mk

ki

mk

ki

i

i

m�

�

��

�

�

��

��

�

��

)/(4193096,020

3861937,8)(ˆ)(ˆ 3

hamm

xVxV

m

m��

2

a3) estimativas para a primeira ocasião da amostra de ta-manho mk +

hammk

x

x

mk

i

i

mk/6735,10

40

94,426 31��

��

��

�

�

23

2

1

2

12

)/(966305,1039

40

94,4266300,4984

1

)(

)(ˆ hammk

mk

x

x

xV

mk

i

mk

i

i

i

mk�

�

��

��

�

��

�

�

�

�

23)/(2741576,0

40

9663,10)(ˆ)(ˆ ham

mk

xVxV

mk

mk��

��

�

�

hamxVxsmkmk

/523601,02741576,0)(ˆ)( 3��

394

Amostragem em inventário florestal Waldenei Travassos de Queirozham

mk

x

x

mk

i

i

mk/6735,10

40

94,426 31��

��

��

�

�

23

2

1

2

12

)/(966305,1039

40

94,4266300,4984

1

)(

)(ˆ hammk

mk

x

x

xV

mk

i

mk

i

i

i

mk�

�

��

��

�

��

�

�

�

�

23)/(2741576,0

40

9663,10)(ˆ)(ˆ ham

mk

xVxV

mk

mk��

��

�

�

hamxVxsmkmk

/523601,02741576,0)(ˆ)( 3��

a4) limite de erro para a estimativa mkx + (primeira ocasião)

%81,91006735,10

523601,02100

)()( ��

��

��

�

�

�

mk

mk

mk

x

xstxLE

a5) estimativas para a segunda ocasião da subamostra de tamanho m

hamm

y

y

mk

ki

i

m /046,1620

92,320 31��

��

��

23

2

2

1

1

2

)/(1159095,219

20

92,3206846,5189

1

)(

)(ˆ hamm

m

y

y

yV

mk

ki

imk

ki

i

m �

�

��

�

�

��

�

��

��

23 )/(1057954,020

1159095,2)(ˆ)(ˆ ham

m

yVyV m

m ��

a6) estimativas para a segunda ocasião da subamostra de tamanho n

hamn

y

y

nmk

mki

i

n /76,1510

60,157 31 ��

��

��

23

2

1

2

12

)/(8263,29

10

60,157213,2509

1

)(

)(ˆ hamn

n

y

y

yV

nmk

mki

nmk

mki

i

i

n �

�

��

�

�

��

��

��

��

23)/(2826,0

10

8263,2)(ˆ)(ˆ ham

n

yVyV

n

n ��

395


hamn

y

y

nmk

mki

i

n /76,1510

60,157 31 ��

��

��

23

2

1

2

12

)/(8263,29

10

60,157213,2509

1

)(

)(ˆ hamn

n

y

y

yV

nmk

mki

nmk

mki

i

i

n �

�

��

�

�

��

��

��

��

23)/(2826,0

10

8263,2)(ˆ)(ˆ ham

n

yVyV

n

n ��

a7) estimativas para a segunda ocasião da amostra de ta-manho nm +

hamnm

y

y

nmk

ki

i

nm /9507,1530

52,478 31 ��

�

��

��

�

23

2

1

2

12

)/(2822064,229

30

52,478897,7698

1

)(

)(ˆ hamnm

nm

y

y

yV

nmk

ki

nm

i

i

i

nm �

�

��

��

�

��

��

�

�

�

23 )/(076073546,030

2822064,2)(ˆ)(ˆ ham

nm

yVyV nm

nm ��

� �

�

hamyVys nmnm /275814,0076073546,0)(ˆ)(3

��

a8) limite de erro para a estimativa nmy + (segunda ocasião)

%46,31009507,15

275814,02100

)()( ��

�

��

�

�

�

�

�

nm

nm

nmy

ystyLE

a9) estimativas do incremento para a subamostra de tamanho m

396


a10) limite de erro da estimativa do incremento consideran-do a subamostra m (parcelas permanentes)

%83,1210014,5

329826,02100

)()( ��

�

��

�

�

m

m

md

dstdLE

a11) estimativas do incremento para as subamostras de tamanhos n e k

hamxyd knnk /319,5441,1076,15 3��

23)/(983119,0

20

009788,14

10

8263,2)(ˆ)(ˆ)(ˆ ham

k

xV

n

yVdV kn

nk ��

a12) estimativas do incremento considerando as subamos-tras nm + e mk +

hamxyd mknmmknm /2772,56735,109507,153

))(( ��

))((

),(ˆ2)(ˆ)(ˆ)(ˆ

nmmk

yxVm

mk

xV

nm

yVdV mmknm

��

�

�

�

�

��

23 )/(211460,03040

16312,4202

40

9663,10

30

2822,2)(ˆ hamdV �

�

��

hamdVds /4598478,0211460,0)(ˆ)( 3��

a13) limite de erro da estimativa do incremento consideran-do as subamostras nm + e mk +

%43,171002772,5

4598478,02100

)()( ��

��

��

d

dstdLE

b) estimativas ASP para a primeira ocasião

b1) estimativa da média xµ

397


Dado que:

Tal que:

9675322,11159095,2

16312,4

)(ˆ

),(ˆˆ ��

yV

yxVB

m

m

xy

976733,01159095,23861937,8

16312,4

)(ˆ)(ˆ

)],(ˆ[ˆ

22

2�

��

�

�

yVxV

yxV

mm

m�

Então:

)(ˆ)(ˆˆmnnmkmkx

yycxxax ��

)046,1676,15(39168337,0)906,10441,10(5972208,0441,10ˆ ��x�

hamx /606686,10ˆ 3��

b2) estimativa da variância )ˆ(ˆxV µ

]ˆ))((

ˆ1[

)(ˆ)ˆ(ˆ

2

2

�

��

knnmmk

mn

mk

xVV

mk

x��

��

��

23 )/(22084983,0)976733,010203040

976733,010201(

40

9663,10)ˆ(ˆ hamV

x�

��

��

Sendo:

hamVsxx

/469947,022084983,0)ˆ(ˆ)ˆ( 3��

398


b3) limite de erro da estimativa ASP xµ (primeira ocasião)

%86,8100606686,10

469947,02100

ˆ

)ˆ()ˆ( ��

��

��

x

x

x

stLE

�

��

c) estimativas ASP para a segunda ocasião

c1) estimativa da média yµ

1976504,0976733,01020)1020)(2020(

4964254,02020

ˆ))((

ˆˆ

2

' ��

��

��

�knnmmk

Bkma

yx

m

7962945,06534,1004

)2020(20

ˆ))((

)(ˆ

2

'��

��

��

��

�knnmmk

mkmcn

Dado que:

4964254,03861937,8

16312,4

)(ˆ

),(ˆˆ ��

xV

yxVB

m

m

yx

Então:)(ˆ)(ˆˆ ''

mnnmkmny yycxxay ��

)046,1676,15(7962945,0)]906,10441,10(1976504,0[76,15ˆ ��y

�

hamy /89583279,15ˆ 3��

c2) estimativa da variância )ˆ(ˆyV µ

]ˆ))((

ˆ1[

)(ˆ)ˆ(ˆ

2

2

�

��

knnmmk

km

nm

yVV nm

y��

��

��

23)/(04648966,0)

6534,1004

976733,020201(

30

2822,2)ˆ(ˆ hamV y �

��

399


Resultando:

hamVs y /215614609,004648966,0)ˆ(ˆ)ˆ(3

��

c3) limite de erro da estimativa ASP yµ (segunda ocasião)

%71,210089583279,15

215614609,02100

ˆ

)ˆ()ˆ( ��

��

��

y

y

y

stLE

�

��

d) estimativas ASP para o incremento

d1) estimativa da média ( dµ )

Dado:

Então:

A estimativa do incremento dµ também pode ser obtida pela expressão:

hamxyd /2891466,5606686,1089583279,15ˆˆˆ 3��

400


d2) estimativa da variância )ˆ(ˆdV µ

m

yxVba

k

xVb

m

xVb

n

yVa

m

yVaV m

ddk

dm

dn

dm

dd

),(ˆˆˆ2

)(ˆ)ˆ1(

)(ˆˆ)(ˆ

)ˆ1()(ˆ

ˆ)ˆ(ˆ 222 ++++−+=µ

Tal que:

21)ˆ(ˆ VVV d ��

m

xVb

n

yVa

m

yVaV m

d

n

d

m

d

)(ˆˆ)(ˆ

)ˆ1()(ˆ

ˆ 22

1��

m

yxVba

k

xVbV m

dd

k

d

),(ˆˆˆ2

)(ˆ)ˆ1( 2

2��

20

386,8)794871146,0(

10

826,2)187978262,11(

20

116,2187978262,1

222

1 ��V

424222818,01 �V

20

16312,4)794871146,0(187978262,12

20

01,14)794871146,01( 2

2��V

363643578,02 ��V

23

21 )/(06057924,0)ˆ(ˆ hamVVV d ��

Sendo:

hamVsdd

/246128503,006057924,0)ˆ(ˆ)ˆ( 3��

d3) limite de erro da estimativa ASP da média do incremen-to ( dµ )

%31,91002891466,5

246128503,02100

ˆ

)ˆ()ˆ( ��

��

��

d

d

d

stLE

�

��

f) discussão dos resultados e conclusões

Os resultados, apresentados na Tabela 10.10, demonstram que os procedimentos com substituição parcial são mais eficien-

401


tes que os seus correspondentes não SPR, pois apresentam va-lores menores para os limites de erro.

tabela 10.10 - Limites de erro das principais estimativas.

Estimadores Estimativas Limites de erro

mkx + 10,6735 9,81

nmy + 15,9507 3,46

mknm xyd ++ −= 5,2772 17,43

md 5,1400 12,83

xµ 10,6067 8,86

yµ 15,8958 2,71

dµ 5,2891 9,31

Definindo-se eficiência como a razão entre os limites de erro, têm-se:

f1) estimador xµ versus mkx +

1072,1%86,8

%81,9100

)ˆ(

)(��

�

x

mk

LE

xLEEf

�

O estimador da primeira ocasião xµ é 10,72% mais eficien-te que o estimador .mkx +

f2) estimador yµ versus nmy +

2768,1%71,2

%46,3100

)ˆ(

)(��

�

y

nm

LE

yLEEf

�

O estimador da segunda ocasião yµ é 27,68% mais efi-ciente que o estimador .nmy +

402


f3) estimador dµ versus mknm xyd ++ −=

8722,1%31,9

%43,17100

)ˆ(

)(��

dLE

dLEEf

�

O estimador para o incremento médio entre as duas ocasi-ões dµ é 87,22 % mais eficiente que o estimador .mknm xyd ++ −=

f4) estimador dµ versus mmm xyd −=

3781,1%31,9

%83,12100

)ˆ(

)(��

d

m

LE

dLEEf

�

O estimador para o incremento médio entre as duas ocasi-ões dµ é 37,81 % mais eficiente que mmm xyd −= (parcelas per-manentes).

cApítulo 11

FormA e tAmAnho dAs unIdAdesde AmostrA

Mostra a importância em utilizar um tamanho adequado de unidade de amostra em inventário florestal, explanando ser ló-gico existir um intervalo ideal de tamanhos, onde a eficiência é máxima e o custo é mínimo. Aborda os principais fatores que influenciam o tamanho e a forma das parcelas. Apresenta pes-quisas comparando a eficiência em relação ao nível de precisão de inventários florestais, considerando diversos tamanhos de unidades de amostra. Discorre sobre vários métodos para obter o tamanho ideal da parcela quando a precisão estatística é o critério utilizado.

405

Forma e tamanho das unidades de amostra

Inicialmente, pode-se afirmar não existir empecilho de or-dem teórica em utilizar qualquer tamanho de parcela para obter estimativa não-tendenciosa do volume de madeira de uma flo-resta, obviamente, desde que a sua localização seja não-ten-denciosa. Por outro lado, é lógico supor a existência de um in-tervalo ideal de tamanhos, onde a eficiência é máxima e o custo é mínimo.

Dentre os principais fatores que influenciam o tamanho e a forma das parcelas, destacam-se: o objetivo do inventário flo-restal, o grau de precisão desejado e a variabilidade da variável resposta.

As pesquisas têm demonstrado que comparando a efici-ência em relação ao nível de precisão de inventários florestais, considerando a mesma fração amostral, a precisão aumenta à medida que os tamanhos das unidades se tornam menores. Obviamente, os custos aumentam, pois, as parcelas tornam-se mais numerosas. As pesquisas recomendam o uso de parcelas que contenham um número de árvores representativo, que não seja demasiadamente grande face ao tempo requerido para me-dição. Husch (1971) recomenda um tamanho que englobe em torno de um número básico de 20 árvores.

Queiroz (1977), pesquisando na Amazônia os efeitos da va-riação estrutural das unidades de amostra no processo de amos-tragem por conglomerado, para o volume de madeira para árvo-res com DAP ≥ 30 cm, verificou que o coeficiente de variação decresceu exponencialmente com o tamanho da subunidade de amostra, estabilizando-se levemente quando o tamanho atingiu em torno de 0,25 ha a 0,32 ha, tamanho considerado ideal.

Silva (1980), também pesquisando na Amazônia e consi-derando a variável resposta volume de madeira para todas as árvores com 15 cm ,4515 cmDAPcm ≤≤ 45 cm, verificou o tamanho ideal de

406


0,09 ha, e para o volume de árvores com DAP ≥ 45 cm encon-trou o tamanho ideal de 0,25 ha.

Higuchi et al. (1982), com base em 32 diferentes tamanhos de parcelas, em floresta de terra firme com DAP ≥ 25 cm lo-calizada no Distrito Agropecuário da Superintendência da zona Franca de Manaus-SUFRAMA, no estado do Amazonas, estu-daram o tamanho ideal para inventários florestais, concluindo pelo tamanho ideal de 37,5 m x 150 m (0,5625 ha). O critério utilizado por esses autores para a seleção foi a Eficiência Relati-va (ER %), segundo Husch, Miller e Beers (1972), que relaciona o custo de medição e a precisão desejada, através da fórmula

100%

22

11�

�

�

�

CSE

CSEER

, sendo:

SE1 = desvio padrão considerando a parcela padrão de ta-manho 5 m x 200 m;

SE2 =desvio padrão do tamanho da parcela a ser compa-rada;

1C = custo de medição da parcela básica;2C = custo de medição da parcela a ser comparada.

Péllico Netto (1979) introduziu o conceito de eficiência por dia de trabalho (EDT), objetivando considerar alguns fatores re-levantes na definição do tamanho da unidade de amostra, como: o tamanho da área a ser inventariada, os tempos de desloca-mento, os tempos de medição, o número de horas a trabalhar por dia, as condições de acesso à área e dentro dela, assim como as adversidades que dificultam a penetração na floresta.

21

)1(

v

An

v

nn

Af

EDT d

d

�

�

� , tal que:

407


Af = tamanho da área a ser inventariada;n = tamanho da amostra;

dn = número de unidades medidas por dia de trabalho;A = área da unidade de amostra;

1v = velocidade de caminhamento entre unidades de amostra;2v = velocidade de medição das unidades de amostra.

Substituindo EDT = 8 horas, carga horária por dia, na equa-ção desenvolvida, o autor achou a seguinte fórmula para a ob-tenção do tamanho ótimo para a unidade de amostra:

2

1

1

]

)1(8

[ vnv

nn

afv

Ad

d ��

�

No que concerne à forma de parcela em inventários flores-tais, as pesquisas mostram que a forma da unidade de amostra não influencia na precisão e na exatidão nos diversos métodos de amostragem, e que os principais fatores que influenciam a definição da forma são o perímetro e a facilidade do estabele-cimento em campo. Sob o ponto de vista teórico, as unidades circulares são as mais eficientes, devido possuírem a maior rela-ção entre a área e o perímetro, resultando na redução da proba-bilidade de ocorrência de árvores limítrofes, tornando mais exato o cálculo do volume na parcela.

Em inventários de florestas naturais na Amazônia, parcela grande com forma circular apresenta dificuldades na implanta-ção e medição devido o controle das árvores limítrofes, assim como tornam difícil a operacionalização do trabalho de campo, por causa da grande densidade de árvores no sub-bosque.

As parcelas retangulares, com largura de 20 m no máximo, são muito utilizadas em inventários de florestas tropicais natu-rais, principalmente devido à facilidade de implantação e me-

408


dição. Entretanto, apresentam a desvantagem de maximizar a ocorrência de árvores na bordadura. Uma vantagem importante das parcelas retangulares de comprimento longo em relação à largura é a possibilidade de estudar a variação da tipologia e, através de um processo de pós-estratificação, tornar possível a elaboração de mapas florestais, que são importantes para pla-nejar o manejo de uma floresta.

11.1 MÉTODOS PARA OBTER O TAMANHO IDEAL

Existem vários métodos para obter o tamanho ideal da par-cela quando a precisão estatística é o critério utilizado, desta-cando-se entre eles:

a) método da curvatura máxima

É o método mais antigo, proposto por Federer (1955), o qual consiste na obtenção dos dados inerentes às unidades básicas, combinadas de forma a se ter valores para vários ta-manhos de parcela. Calcula-se, para os vários tamanhos, um parâmetro ou índice que estime variabilidade, como variância, coeficiente de variação ou erro padrão. Os valores do índice de variação e os diversos tamanhos de parcela são plotados em um sistema de eixos coordenados e, a partir do gráfico, é obtido o ponto de curvatura máxima, o qual é definido como o ponto a partir do qual os valores do índice de variabilidade utilizado co-meçam a estabilizar. Esse ponto determina o tamanho ideal da unidade de amostra.

Este método possui duas desvantagens: 1) Não considera os custos dos inventários considerando

os diferentes tamanhos de parcelas.

409


2) O ponto de curvatura máxima depende do menor tama-nho de parcela usada, como também da escala utilizada.

Objetivando dar uma ideia acerca da variabilidade do coefi-ciente de variação em função do tamanho da unidade de amos-tra, seja o experimento apresentado por Queiroz (1977), o qual considerou 25 unidades básicas de 400 m2 em um inventário de uma área de 5.324,04 ha, localizada na Floresta Nacional do Ta-pajós, no município de Santarém - estado do Pará. A Tabela 11.1 apresenta os valores dos coeficientes de variação considerando os 25 tamanhos de parcelas e a Figura 11.1 mostra o gráfico construído a partir destes dados.

tabela 11.1 - Valores dos coeficientes de variação por tamanho de parcela.

Parcelas (m2) CV% Parcelas (m2) CV% Parcelas (m2) CV%

400800120016002000 2400280032003600

101,08 75,04 67,86 58,51 53,56 48,78 44,45 41,62 39,74

400044004800520056006000640068007200

40,1539,1637,5135,9434,9234,8833,4731,8730,51

760080008400880092009600

10000

27,7929,5129,3328,2728,2327,9627,95

410


Co

efi

cie

nte

de

vari

ação

(%

)

Figura 11.1- Comportamento do coeficiente de variação em função do tama-nho da parcela.

O modelo matemático ,2

1

aAaCV � ajustado sob a transfor-

mação logarítmica ,logloglog 10211010 AaaCV �� apresentou os seguintes resultados:

ACv 1010 log410743,0077164,3log ��

F=3097,43

�2

ajr 0,9923

De acordo com Hoffmann e Vieira (1977), o coeficiente de determinação ajustado para os graus de liberdade é dado pela expressão:

)1(2

1 222 rn

rraj

�

�

��

Tal que:

TOTAL

REGRESSÃO

SQ

SQr �2

n = número de observações

411


b) método modificado da máxima curvatura

Considerando que o ponto de curvatura máxima é geral-mente determinado por inspeção visual e que é possível ajustar uma curva para o parâmetro índice de variabilidade em função do tamanho da parcela, define-se que o tamanho ótimo corres-ponderá à abscissa, tal que a derivada da função seja igual a – 1. Isso significa dizer que, depois deste ponto, o incremento de uma nova unidade básica resultará numa redução da variável dependente - o coeficiente de variação - menor que a unidade, denotando ser inviável promover aumentos adicionais na parce-la a ser eleita.

c) método do índice de heterogeneidade

Ferreira (1996) cita que esse método foi proposto por Smi-th (1938) e baseia-se numa relação empírica entre o tamanho da parcela e a variância, estabelecendo uma dependência negativa expressa pelo modelo matemático

ba

k k

VV = , tal que quando o ta-

manho relativo da parcela aumenta, a variância relativa diminui. Neste modelo matemático, têm-se:

kV = variância por unidade de área entre as parcelas de tamanho correspondente a k unidades básicas;

aV = variância considerando as parcelas correspondentes em tamanho à unidade básica;

k = número de unidades básicas utilizado por parcela;b = índice de heterogeneidade medido pela correlação en-

tre unidades básicas adjacentes.Então, tem-se o modelo ,logloglog kbVV ak −= depreen-

dendo que o índice de heterogeneidade b é o coeficiente de

412


regressão, de modo que a variável dependente é o logaritmo da variância entre as parcelas de tamanho correspondente a k unidades básicas e a variável independente é o logaritmo do nú-mero de unidades básicas correspondentes da parcela.

De acordo com Smith (1938), a fórmula para obter o valor de k, tornando mínimo o custo por unidade de informação é:

2

1

)1( cb

bck

�

�

Tal que:1c = custo associado somente ao número de parcelas;2c = custo por unidade de área.

consIderAções FInAIs

Aborda sobre as dificuldades no uso de análise estatísti-ca em inventários florestais, citando que é notória a dificuldade enfrentada pelos estudantes e profissionais devido à falta de ex-periência no contexto de aplicações dos métodos estatísticos, principalmente na aplicação de técnicas estatísticas multidimen-sionais. Discorre sobre inventário para subsidiar a operacionali-zação de um projeto de manejo florestal que, obrigatoriamente, define, distingue e delimita as comunidades com características fitossociológicas semelhantes, ressaltando que os métodos es-tatísticos univariados não oferecem o suporte suficiente para atender a essas análises. Descreve que as soluções para es-ses questionamentos só podem ser obtidas pelo uso de análise multivariada. Discute sobre a adequacidade do uso de algumas técnicas multivariadas em inventários florestais.

415

O objetivo principal deste livro é orientar o aprendizado no campo da análise estatística univariada, visando ao planejamen-to de inventário florestal, no qual é notória a dificuldade enfren-tada pelos estudantes e profissionais, principalmente, devido à falta de livros didáticos escritos em português, em linguagem adequada ao contexto dos métodos estatísticos.

Por outro lado, este livro é uma pequena contribuição na difícil tarefa de resolver os problemas da análise de inventários florestais, principalmente de florestas naturais, destarte não ob-jetiva apresentar todos os métodos estatísticos, com vista a sub-sidiar a análise de inventário para o manejo florestal sustentável, visto a complexidade requerida para se atender tal fim. A seguir algumas considerações para aguçar a discussão sobre o pro-blema.

O inventário para subsidiar a operacionalização de um projeto de manejo florestal, obrigatoriamente, define, distingue e delimita as comunidades com características fitossociológicas semelhantes; e, obviamente, os métodos estatísticos univaria-dos não oferecem o suporte suficiente de análise para atender esse objetivo.

As experiências na Amazônia demonstram que estratifica-ções estabelecidas mediante a interpretação de fotocoberturas, apesar de importante e informativa, não são capazes de expli-car, com o detalhamento requerido, as inter-relações das vari-áveis envolvidas, principalmente, nas vegetações localizadas nos sub-bosques da floresta. O direcionamento indicado seria compatibilizar os recursos de sensoriamento remoto e de plane-jamento de amostragem – recomenda-se o uso da amostragem sistemática - a uma análise estatística multivariada.

A análise multivariada apresenta algumas complexidades com relação à compreensão de sua teoria estatística e à compu-

416

tação das análises dos dados. Entretanto, sob o ponto de vista prático da explicação dos efeitos das características fitossocio-lógicas, é inegável ser um instrumento poderoso para interpretar as correlações inter e intra dos tipos florestais, o que os recursos disponíveis através dos diversos índices fitossociológicos unidi-mensionais existentes na literatura deixam a desejar, principal-mente, por não apresentarem estruturas de lógica matemática e de método estatístico.

O problema mais complexo em termos de inventário para o manejo de florestas naturais é a análise do inventário contínuo com parcelas permanentes, o qual tem o objetivo de explicar a tendência de crescimento da floresta. Para subsidiar a estrutura-ção dos tratos silviculturais a serem aplicados na recomposição da floresta tropical, destaca-se que, obrigatoriamente, a análise estatística deverá ter em mira detectar e classificar os agrupa-mentos de espécies que possuam as mesmas tendências de desenvovimento (perfis de crescimento).

As soluções para os questionamentos acima descritos só podem ser obtidas pelo uso de análise multivariada e, em alguns problemas, até recomenda-se a aplicação conjunta de vários métodos multivariados.

As técnicas multivariadas de componentes principais e análise de fatores podem ser utilizadas para diminuir a dimen-sionalidade dos dados, o que possibilitará, a partir de um número menor de variáveis, explicar mais facilmente suas inter-relações. A análise de componente principal e a análise de fatores são im-portantes para construir índices fitossociológicos e a partir deles produzir mapas delimitando as comunidades florestais.

As técnicas de análises de agrupamento, de discriminante e de análise de variância multivariada, podem ser usadas con-juntamente para delimitar, classificar e comparar – discriminar

417

– tipos florestais e, assim, obter mapas de vegetação baseados nas variáveis mais importantes na explicação das estruturas flo-rística e ecológica da vegetação.

É importante no manejo florestal estudar as inter-relações entre grupos de variáveis. Por exemplo, um grupo pode ser for-mado por variáveis florísticas e o outro pelas variáveis que refle-tem a fertilidade de solo. A análise de correlação canônica pode-rá explicar essas correlações, fornecendo inclusive mapas mos-trando a estratificação das diversas relações solo-vegetação.

Em relação à análise de inventário florestal contínuo com parcelas permanentes, a análise multivariada denominada de medidas repetidas, através das técnicas de análises de levanta-mentos longitudinais, podem atender ao objetivo de obter grupos formados por espécies com a mesma tendência de crescimento.

419

reFerêncIAs

BANZATTO, D. A.; KRONKA, S. N. experimentação agronômi-ca. Jaboticabal: FUNEP, 1989. 247 p.

BARBIN, D. componentes de variância: teoria e aplicação. 2. ed. Piracicaba: FEALQ, 1993. 120 p.

BOLFARINE, H.; BUSSAB, W. O. elementos de amostragem. São Paulo: Edgard Blücher, 2005. 269 p.

BORGES, B. H. Projeto de manejo florestal da Fazenda San-ta lúcia: serraria marajoara. Belém: IBAMA, 1990.

CAMPOS, H. Amostragem. Piracicaba: ESALQ, 1981. Apostila.

CHACIN LUGO, F. Tamaño de parcela experimental y su forma. revista de la Facultad de Agronomia, Maracay, v. 9, n. 3, p. 55-74, 1977.

COCHRAN, W. G. sampling techniques. 3. ed. New York: J. Wiley, 1977. 428 p.

______. técnicas de amostragem. Rio de Janeiro: Fundo de Cultura, 1965. 555 p.

CUNIA, T. two successive measurements: the SPR model no auxiliary variables. Syracuse: [s. n.], 1974.

CUNIA, T.; CHEVROU, R. B. Sampling with partial replacement on three or more occasions. Forest science, Lawrence, v. 15, p. 204-224, 1969.

FEDERER, W. T. experimental design, theory and applica-tion. New York: Macmillan, 1955. 593 p.

420

FERREIRA, P. V. estatística experimental aplicada à agrono-mia. 2. ed. Maceió: EDUFAL, 1996. 606 p. FLORES, O. M. M. estudo comparativo de tamanhos e dis-tâncias em processo de amostragem por conglomerado. 2010. 67 f. Dissertação (Mestrado em Ciências Florestais) – Uni-versidade Federal Rural da Amazônia, Belém, 2010. FONSECA, J. S.; MARTINS, G. A. curso de estatística. 3. ed. São Paulo: Atlas, 1982. 286 p. FREESE, F. elementary forest sampling. Washington: USDA, 1962, 91 p. (Handbook, 232). GOMES, F. P. curso de estatística experimental. 14. ed. Pira-cicaba: ESALQ, 2000. 477 p.GOMES, F. P.; NOGUEIRA, I. R. Análise matemática. 2. ed. Piracicaba: Augegraf, 1980. 371 p. HOFFMANN, R.; VIEIRA, S. Análise de regressão: uma intro-dução à econometria. São Paulo: HUCITEC; EDUSP, 1977. 339 p. HIGUCHI, N. et al. Tamanho de parcela amostral para inventá-rios florestais. Acta Amazônica, Manaus, v. 12, n. 1, p. 91-103, 1982. HUSCH, B. Planificacion de un inventario florestal. Roma: FAO, 1971. 135 p. HUSCH, B.; MILLER, C. L.; BEERS, T. W. Forest mensuration. 3. ed. New York: J. Wiley, 1972. 402 p. LOETSCH, F.; HALLER, K. E. Forest inventory. Minchin: BLV Verlagsgesellschaft, 1964. MOOD, A. M.; GRAYBILL, F. A.; BOES, D. C. Introduction to the theory of statistics. 3. ed. New York: Mc Graw-Hill, 1964. 564 p. PÉLLICO NETTO, S.; BRENA, D. A. Inventário florestal. Curi-tiba, 1997. 316 p.

421

PÉLLICO NETTO, S. plano de colonização do Alto turi. In-ventário Florestal. Curitiba: Centro de Pesquisas Florestais da UFPR, 1971. 238 p.PÉLLICO NETTO, S. die Forstinventuren in Brasilien- neue entwicklungen und ihr Beitrag für eine geregelte Forstwirts-chaft. 1979. 232 f. Tese (Doutorado em Engenharia Florestal) - Mitteilungen aus dem Arbeitskreis für Forstliche Biometrie, Frei-burg,1979. PINHEIRO, J. G. Análise da eficiência das estimativas por razão em conglomerados em inventário florestal na Amazô-nia. 2011. 46 f. Dissertação (Mestrado em Ciências Florestais) – Universidade Federal Rural da Amazônia, Belém, 2011. PISKOUNOV, N. cálculo diferencial e integral. 4. ed. Porto: Lopes da Silva, 1978. v. 2. QUEIROz, W. T. Análise de fatores (“Factor analysis”) pelo método de máxima verossimilhança: aplicação ao estudo de estrutura de florestas tropicais. 1984. 112 f. Tese (Doutorado em Engenharia Florestal) – Escola Superior de Agricultura Luiz de Queiroz, Piracicaba, 1984. ______. Análise univariada de inventários florestais contínuos: parcelas permanentes. Boletim da FcAp, Belém, n. 21, p. 33-49, dez. 1993a. ______. Estimativa por razão: aplicação em levantamentos flo-restais. Boletim da FcAp, Belém, n. 21, p. 51-63, dez. 1993b. ______. efeitos da variação estrutural em unidades amos-trais na aplicação do processo de amostragem por conglo-merados nas florestas do Planalto do Tapajós. 1977. 109 f. Dissertação (Mestrado em Engenharia Florestal) – Universidade Federal do Paraná, Curitiba, 1977. ______. o modelo de amostragem com substituição parcial (spr) para duas mensurações sucessivas. Trabalho apre-

422

sentado no Seminário da Pós-Graduação. Piracicaba: ESALQ, 1983.______. Técnicas de amostragem em inventário florestal nos trópicos. Belém: FCAP. Serviço de Documentação e Infor-mação, 1998. 147 p. ROLLET, B.; QUEIROZ, W. T. Observações e contribuições aos inventários florestais na Amazônia. In: CONGRESSO FLORES-TAL BRASILEIRO, 3., 1978, Manaus. Anais... São Paulo: So-ciedade Brasileira de Silvicultura, 1978. v. 2, p. 405-408. (Edição especial da revista Silvicultura, n. 14). SANQUETTA, C. R. et al. Inventários florestais: planejamento e execução. 2. ed. Curitiba: Multi-Graphic, 2009. 316 p. SHIVER, B. D. BORDER, B. E. sampling techniques for forest resource inventory. New York: Jhon Wiley e Sons, 1996. 356 p. SATTERTHWAITE, F. E. An approximate distribution of estima-tes of variance components. Biometrics, Washington, n. 2, p. 110-114, 1946. SCOLFORO, J. R. Inventário florestal. Lavras: ESAL - FAEPE, 1993. SEARLE, S. R. linear models. New York: J. Wiley, 1971. 532 p. SILVA, J. N. M. Eficiência de diversos tamanhos e formas de unidades de amostras aplicadas em inventário florestal na região do Baixo tapajós. 1980. 83 f. Dissertação (Mestrado em Engenharia Florestal) – Universidade Federal do Paraná, Curiti-ba, 1980. SMITH, H. F. An empirical law describing heterogeneity in the yields of agricultural crops. journal of Agricultural science, Cambridge, n. 28, p. 1-23, 1938. SUPERINTENDêNCIA DO DESENVOLVIMENTO DA AMA-ZÔNIA. Levantamentos florestais realizados pela missão FAO

423

na Amazônia (1956-1961). Belém: Divisão de Documentação, 1974. v. 1. STEEL, R. G. D.; TORRIE, J. H. principles and procedures of statistics with special biological sciences. New York: Mc Grall-Hill, 1960. 481 p. YARED, J. A. G. comportamento e viabilidade de procedi-mento de cordia alliodora (ruiz e pav.) okem, no planalto do tapajós – Belterra, pA. 1983. 108 f. Dissertação (Mestrado em Engenharia Florestal) – Escola Superior de Agricultura Luiz de Queiroz, Piracicaba, 1983. WARE, K. D.; CUNIA, T. Continuos forest inventory with partial replacemente of samples. Forest science monograph, Wa-shington, n. 3, 1962. VRIES, P. G. sampling theory for inventory: a teach-yourself course. New York: Springer-Verlag, 1986. 399 p.

425

glossárIo

Acurácia: é o grau de precisão de uma quantidade medida ou calculada em relação ao seu verdadeiro valor.

Ajustamento de curvas: procedimento matemático destinado a obter o modelo mais ajustado entre duas ou mais variáveis – uma dependente (Y) e outra(s) independente(s).

Aleatório: ao acaso, randômico. Seja uma população composta por N indivíduos e deseja-se retirar uma amostra de tamanho n. A amostra será aleatória se a chance de cada indivíduo ser selecionado for igual a .N

n .

Alfa (a ): denominado como erro tipo I, constitui a probabilidade de aceitação de 0H (hipótese de nulidade) quando ela for falsa, ou seja, quando ela não deveria ser aceita.

Amostra: é uma parte da população selecionada para represen-tar a mesma.

Amostragem: quando trabalhamos com uma parte da popula-ção (amostra).

Amostra probabilística: toda amostra que permite fazer infe-rência sobre a população.

Amostragem com reposição: método de amostragem no qual cada unidade da população selecionada para compor a amostra é reposta à população antes da retirada da próxima unidade.

Amostragem estratificada: é o processo que consiste em divi-dir a população de tamanho igual a N unidades, em subpopula-ções ou estratos constituídos de iN unidades, respectivamente, tal que não haja superposições e, juntas, totalizem a população de tamanho .∑ =

ii NN

426

Amostragem por conglomerados ou grupos: é uma variação de qualquer processo de amostragem que, em vez de utilizar unidades de amostra individuais, a unidade de amostra é forma-da por grupo de pequenas subparcelas.

Amostragem sem reposição: método de amostragem no qual a unidade de amostra selecionada para compor a amostra não é reposta na população antes da retirada da próxima unidade.

Amostragem simples ao acaso: é uma amostragem probabi-lística em que todos os indivíduos têm a mesma probabilidade de serem sorteados.

Amostragem sistemática: consiste em sortear uma unidade da população e, a partir dela, para constituir uma amostra de tama-nho n, selecionar as unidades que ocupam pela ordem sequen-cial as posições múltiplas do valor da razão entre o número total N de unidades e o número n de unidades da amostra.

Amostras independentes: os conjuntos amostrais de valores não estão relacionados entre si.

Biometria ou Bioestatística: estatística aplicada às ciências biológicas.

censo: mensuração de todos os indivíduos da população.

Coeficiente de correlação intraconglomerado: é o coeficiente que explica o grau de homogeneidade entre subparcelas dentro do conglomerado. Quando maior que zero, a amostragem por con-glomerados é menos precisa que a simples ao acaso, e quando menor que zero, a amostra por conglomerado é mais precisa que a simples ao acaso. Essas amostragens possuem a mesma pre-cisão se o coeficiente de correlação intraconglomerado for zero.

Coeficiente de variação: é a estatística que permite avaliar a variabilidade das observações, buscando-se uma comparação relativa entre o desvio padrão e a média.

427

correlação: é a estatística que mede a magnitude e o sentido do grau de associação entre duas variáveis aleatórias.

correlação linear: é a estatística que mede a magnitude e o sentido (positivo ou negativo) do grau de associação linear entre duas variáveis aleatórias.

covariância: é a estatística que mede a tendência à variação si-multânea, em grandeza e sinal, das observações inerentes a duas variáveis aleatórias. É a média (ou esperança matemática) do pro-duto dos afastamentos de cada variável em relação à respectiva média (ou esperança matemática): Cov(x,y) = E[x – E(x) (y – E(y)].

curva “t” de student: distribuição de probabilidade que apre-senta as seguintes características: distribuição simétrica; curva mesocúrtica; platicúrtica ou leptocúrtica, dependendo dos graus de liberdade. Quando a forma é mesocúrtica se assemelha à distribuição normal.

delineamento experimental: é o plano estabelecido na mon-tagem do experimento e implica na forma como os tratamentos serão designados às unidades amostrais. Há um entendimento sobre as análises estatísticas a serem efetuadas quando todos os dados estiverem disponíveis.

desvio padrão: é a medida de dispersão que determina a varia-bilidade entre cada escore e a sua respectiva média da popula-ção ou da amostra. É a raiz quadrada da variância.

dimensionamento da amostra: é obter o tamanho da amostra considerando um determinado nível de significância e um limite de erro ou margem de erro.

distribuição amostral: distribuição de probabilidade de uma estatística induzida pelo plano amostral.

distribuição normal: modelo de distribuição de probabilidades de variáveis aleatórias contínuas. A curva apresenta as seguin-

428

tes características: distribuição simétrica; forma de sino; dois pontos de inflexão; é assintótica.

distribuição probabilística: é o conjunto de duas variáveis; uma que é aleatória (abscissa) e outra que representa as res-pectivas probabilidades (ordenada).

eixo das abscissas: eixo horizontal dos valores, por exemplo, de iX do plano cartesiano.

eixo das ordenadas: eixo vertical dos valores, por exemplo, de

iY do plano cartesiano.

erro ou viés ou Bias: erro casual observado nas amostras ale-atórias, decorrente da variabilidade dos elementos constituintes do universo estudado, pelo fato de que nem todos os indivíduos da população participam da amostra. É um erro que pode levar à conclusão equivocada sobre a população, podendo ocorrer: na seleção da amostra; na coleta dos dados; na análise dos dados; nas conclusões.

erro padrão: estatística que mede a variabilidade das médias amostrais. É o desvio padrão de uma população de médias amostrais, o qual corresponde ao quociente do desvio padrão pela raiz quadrada do tamanho da amostra.

erro tipo I ou erro alfa (a ): é um erro que pode ser cometido na inferência estatística que consiste em rejeitar a hipótese de nulidade quando ela é verdadeira.

erro tipo II ou erro beta ( β ): é um erro que pode ser cometido na inferência estatística que consiste em aceitar a hipótese de nulidade quando ela é falsa.

espaço amostral ou universo: é o conjunto dos pontos amos-trais.

429

esperança matemática de uma variável contínua E(y): seja y uma variável aleatória contínua; definimos como

��

�� dyyyfyE )()( , tal que )(yf é a função de densidade.

esperança matemática de uma variável discreta )(yE : seja y uma variável aleatória discreta que assume os valores

nyyy ,,, 21 L com as respectivas probabilidades nppp ,,, 21 L , então ∑=

iii pyyE )( .

estatística: é a parte da matemática aplicada que estuda dados originados de observações.

estatísticas: são valores numéricos que descrevem as amos-tras como a média, a mediana, a variância, etc.

estimação por intervalo: quando a partir da amostra constrói-se um intervalo com certa probabilidade de conter o verdadeiro valor do parâmetro populacional.

estimação: quando se usa os resultados extraídos da amostra para produzir inferências sobre a população da qual foi extraída aleatoriamente a amostra.

estimador: denomina-se estimador de um parâmetro de uma população a função de elementos de uma amostra oriunda des-sa população, que mantém com o mesmo uma relação.

estimativa por razão: quando se estima o valor de uma variá-vel associada à outra variável; normalmente essas variáveis são correlacionadas.

estimativa: é um valor específico de um estimador como, por exemplo, a média aritmética da altura de uma amostra de árvores.

Estratificação com repartimento ótima: quando o dimensio-namento da amostra tem em vista tornar mínimo o valor da va-riância da média estratificada dentro de um limite de custo para medição da amostra, ou tornar mínimo o custo para um valor estipulado da variância da média estratificada.

430

Estratificação com repartimento, partilha ou alocação pro-porcional: quando o dimensionamento da amostra é feito consi-derando a mesma fração amostral para todos os estratos.

experimento ou ensaio: é um trabalho que segue determina-dos princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos ou populações.

Fator de expansão ou crescimento: é o fator que transforma os resultados da amostra para a população. É o quociente entre o número de unidades da população pelo número de unidades da amostra.

Fração amostral na população: é a razão entre o número de unidades medidas na amostra e o número de unidades total da população.

Fração amostral no estrato: é a razão entre o número de unida-des medidas no estrato e o número de unidades total do estrato.

Função de probabilidade: uma função f (y) de variável discreta, tal que, f (y) 0)( ≥yf 0 e 1)( =∑

x

yf f (y) = 1.

Função densidade: uma função f (y) de variável contínua, tal que f (y) 0)( ≥yf 0 e � �

xdyyf 1)( f (y) dy = 1.

geoestatística: é um conjunto de técnicas usadas para inferir valores para uma determinada variável. Produz estimativas de variáveis com base na probabilidade e na espacialidade das ob-servações.

graus de liberdade: são os indexadores estatísticos correspon-dentes ao número de observações independentes.

heterogeneidade de variâncias ou heterocedasticidade: é quando ocorre desigualdade de variâncias, o que pode ser veri-ficado através de vários testes.

431

hipótese Alternativa ( HA ): é a hipótese que é aceita quando a hipótese de nulidade é rejeitada, no sentido de afirmar que há diferenças ou associações entre os grupos objetos da pesquisa, as quais não podem ser explicadas pelo acaso.

hipótese da nulidade ( H0 ): é a hipótese que se testa conside-rando que as possíveis diferenças ou associações encontradas entre grupos objetos do estudo são devido ao acaso.

hipótese estatística: é a especificação de um dos parâmetros de uma população ou da relação entre os parâmetros de duas ou mais populações.

Inferência estatística: é o procedimento de efetuar conclusões acerca de uma população baseado em uma amostra desse uni-verso.

Intervalo de confiança: quando a partir da amostra constrói-se um intervalo com certa probabilidade de conter o verdadeiro valor do parâmetro populacional para um determinado nível de confiança (1 – a), tal que a é o nível de significância do teste.

Krigagem: dentro da geoestatística é um conjunto de técnicas usadas para inferir valores para uma variável distribuída no es-paço em locais não amostrados.

limite de erro ou margem de erro: é a semiamplitude do inter-valo de confiança expresso em porcentagem da média.

Média estratificada estimada: é o valor médio não tendencioso que estima o valor médio populacional. É uma média ponderada pelo peso representativo de cada estrato.

parâmetro: é uma função do conjunto de valores (uma caracte-rística) de uma população.

peso do estrato: é razão entre o número de unidades total do estrato e o número total de unidades da população.

432

plano amostral: documento de registro descrevendo os méto-dos e medidas para obtenção da amostragem.

ponto amostral: cada acontecimento que possa ocorrer em um experimento.

população: é o conjunto de todos os indivíduos ou unidades sobre os quais se deseja estabelecer determinados estudos.

população amostrada: população da qual foi retirada a amos-tra.

População finita: quando a amostra se constitui no mínimo de 5% dos indivíduos da população.

População infinita: quando a amostra se constitui no máximo de 5% dos indivíduos da população.

população objetivo: população que se pretende atingir.

probabilidade: é a mensuração matemática usada para des-crever a chance de ocorrência de um valor específico de uma variável aleatória ou de eventos amostrais.

p-valor ou p(valor): é a probabilidade, na inferência estatística, de se cometer um erro de conclusão - Erro tipo I -, rejeitando-se a Hipótese de nulidade se ela for verdadeira.

razão: é o quociente entre os valores de duas variáveis.

repetições: é o mesmo tratamento aplicado a mais de uma uni-dade de amostra da mesma população.

semivariograma: estuda e descreve a variabilidade espacial do fenômeno. Denominada também de análise estrutural ou mode-lagem do variograma.

seleção não probabilística: qualquer processo intencional de escolher as unidades de amostra ou quando não seja possível estabelecer as probabilidades de inclusão das mesmas.

433

seleção probabilística: processo de selecionar as unidades de amostra que permite estabelecer as probabilidades das mesmas pertencer à amostra.

teste de hipótese: quando a partir dos resultados obtidos da amostra, deseja-se testar certos parâmetros da população ou mesmo testar a natureza da população.

tratamento: é o método ou a população cujo efeito deseja-se medir ou comparar em um experimento ou em um levantamento.

variância: é um momento de dispersão, calculado por um quo-ciente do somatório dos quadrados da diferença entre cada es-core e a respectiva média, e o denominador representado pelo número de graus de liberdade correspondente.

variável aleatória contínua: quando varia num conjunto infinito não enumerável.

variável aleatória discreta: quando assume somente um nú-mero finito de valores ou quando varia num conjunto infinito enu-merável.

variável aleatória “F” de snedecor: variável aleatória definida como a razão de duas variáveis independentes com distribuição qui-quadrado, com k graus de liberdade correspondente ao nu-merador e p graus de liberdade inerente ao denominador. Pos-suindo a sua função densidade denominada “F” de Snedecor.

variável de interesse: característica das unidades da popula-ção que se pretende conhecer.

variável aleatória qui-quadrado: variável aleatória com k graus de liberdade; é definida como a soma de k quadrados de nor-mais padronizadas e independentes. Possui a sua função densi-dade denominado de qui-quadrado.

434

variável aleatória “t” de student: variável aleatória com n-1, tamanho da amostra menos um, graus de liberdade. É definida como o quociente entre a diferença da média estimada e a mé-dia populacional pelo erro padrão. Possui a sua função densida-de denominada “t” de Student.

variável aleatória: é aquela que ocorre com certa probabilidade.

viés ou vício: de um estimador de um parâmetro é a diferença entre o seu valor esperado e o valor do parâmetro.

435

Anexo

tabela 1- áreas da distribuição normal padrão.

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852

0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

436

tabela 2 - Distribuição de 2c .

ak 0,995 0,990 0,975 0,95 0,90 0,75 0,50 0,50 0,10 0,05 0,025 0,01 0,005

1 0,000 0,0002 0,0010 0,0039 0,0158 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88

2 0,010 0,0001 0,0506 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,6

3 0,0717 0,115 0,216 0,352 0,584 1,021 2,37 4,11 6,25 7,81 9,25 11,3 12,8

4 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 11,1 13,3 14,9

5 0,412 0,554 0,831 1,15 1,61 2,67 4,35 6,63 9,24 11,1 12,8 15,1 16,7

6 0,676 0,872 1,24 1,64 2,20 3,45 5,35 7,84 10,6 12,6 14,4 16,8 18,5

7 0,989 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,0 14,1 16,0 18,5 20,3

8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,0

9 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6

10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 16,0 18,3 20,5 23,2 25,2

11 2,60 3,05 3,82 4,57 5,58 7,58 10,3 13,7 17,3 19,7 21,9 24,7 26,8

12 3,07 3,57 4,40 5,23 6,30 8,44 11,3 14,8 18,5 21,0 23,3 26,2 28,3

13 3,57 4,11 5,01 5,89 7,04 9,30 12,3 16,0 19,8 22,4 24,7 27,7 29,8

14 4,07 4,66 5,63 6,57 7,79 10,2 13,3 17,1 21,1 23,7 26,1 29,1 31,3

15 4,60 5,23 6,23 7,26 8,55 11,0 14,3 18,2 22,3 25,0 27,5 30,6 32,8

16 5,14 5,80 6,91 7,96 8,31 11,9 15,3 19,4 23,5 26,3 28,4 32,0 34,3

17 5,70 6,41 7,56 8,67 10,1 12,8 16,3 20,5 24,8 27,6 30,2 53,4 35,7

18 6,26 7,01 8,23 9,39 10,9 13,7 17,3 21,6 26,0 28,9 31,5 34,8 37,2

19 6,84 7,63 8,91 10,1 11,7 14,6 18,3 22,7 27,2 30,1 32,9 36,2 38,6

20 7,43 8,26 9,59 10,9 12,4 15,5 19,3 23,8 28,4 31,4 34,2 37,6 40,0

21 8,03 8,90 10,3 11,6 13,2 16,3 20,3 24,9 29,6 32,7 35,5 38,9 41,4

22 8,64 9,54 11,0 12,3 14,0 17,2 21,3 26,0 30,8 33,9 36,8 40,5 42,8

23 9,26 10,2 11,7 13,1 14,8 18,1 22,3 27,1 32,0 35,2 38,1 41,6 44,2

24 9,89 10,9 12,4 13,8 15,7 19,0 23,3 28,2 33,1 36,4 39,4 43,0 45,6

25 10,5 11,5 13,1 14,6 16,5 19,9 24,3 29,3 34,4 37,7 40,6 44,3 46,9

26 11,2 12,2 13,8 15,4 17,3 20,8 25,3 30,4 35,6 38,9 41,9 45,6 48,3

27 11,8 12,9 14,6 16,2 18,1 21,7 26,3 31,5 36,7 40,1 43,2 47,0 49,6

28 12,5 13,6 15,3 16,9 18,9 22,7 27,3 32,6 37,9 41,3 44,5 48,3 51,0

29 13,1 14,3 16,0 17,7 19,8 23,6 28,3 33,7 39,1 42,6 45,7 49,6 52,5

30 13,8 15,0 16,8 18,5 20,6 24,5 29,3 34,8 40,3 43,8 47,0 50,9 53,7

2,kac

437

tabela 3 - Distribuição “t” de Student.

ak 0,50 0,25 0,10 0,05 0,025 0,01 0,005

1 1,00000 2,4142 6,3138 12,706 25,542 63,657 127,32

2 0,81650 1,6036 2,9200 4,3127 6,2053 9,9248 14,089

3 0,76489 1,4226 2,3534 3,1825 4,1765 5,8409 7,4533

4 0,74070 1,3444 2,1318 2,7764 3,4954 4,6041 5,5976

5 0,72669 1,3009 2,0150 2,5706 3,1634 4,0321 4,7733

6 0,71756 1,2733 1,9432 2,4469 2,9687 3,7074 4,3168

7 0,71114 1,2543 1,8946 2,3646 2,8412 3,4995 4,0293

8 0,70639 1,2403 1,8595 2,3060 2,7515 3,3554 3,8325

9 0,70272 1,2297 1,8331 2,2622 2,6850 3,2498 3,6897

10 0,69981 1,2213 1,8125 2,2281 2,6338 3,1693 3,5814

11 0,69745 1,2145 1,7959 2,2010 2,5931 3,1058 3,4966

12 0,69548 1,2089 1,7823 2,1788 2,5600 3,9545 3,4284

13 0,69384 1,2041 1,7709 2,1604 2,5326 3,0123 3,3725

14 0,69200 1,2001 1,7613 2,1448 2,5096 5,9768 3,3257

15 0,69120 1,1967 1,7530 2,1315 2,4899 2,9467 3,2860

16 0,69013 1,1937 1,7459 2,1199 2,4729 2,9208 3,2520

17 0,68919 1,1910 1,7396 2,1098 2,4581 2,8982 3,2225

18 0,68837 1,1887 1,7341 2,1009 2,4450 2,8784 3,1966

19 0,68763 1,1866 1,7291 2,0930 2,4334 2,8609 3,1737

20 0,68696 1,1848 1,7247 2,0860 2,4231 2,8453 3,1534

21 0,68635 1,1831 1,7207 2,0796 2,4138 2,8314 3,1352

22 0,68580 1,1816 1,7171 2,0739 2,4055 2,8188 3,1188

23 0,68531 1,1802 1,7139 2,0687 2,3979 2,8073 3,1040

24 0,68485 1,1789 1,7109 2,0639 2,3910 2,7969 3,0905

25 0,68443 1,1777 1,7081 2,0595 2,3846 2,7874 3,0782

26 0,68405 1,1766 1,7056 2,0555 2,3788 2,7787 3,0669

27 0,68370 1,1757 1,7033 2,0518 2,3734 2,7707 3,0565

28 0,68335 1,1748 1,7011 2,0484 2,3685 2,7633 3,0469

29 0,68304 1,1739 1,6991 2,0452 2,3638 2,7564 3,0380

30 0,68276 1,1731 1,6973 2,0423 2,3596 2,7500 3,0298

40 0,68066 1,1673 1,6839 2,0211 2,3289 2,7045 2,9712

60 0,67862 1,1616 1,6707 2,0003 2,2991 2,6603 2,9146

120 0,67656 1,1559 1,6577 1,9799 2,2699 2,6174 2,8599

∞ 0,67449 1,1503 1,6449 1,9600 2,2414 2,5758 2,8070

438

tabela 4 - Distribuição “F” de Snedecor para a = 5%.

kp 1 2 3 4 5 6 7 8 9 10 20 30 120

1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 248,0 250,1 253,32 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,45 19,46 19,493 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,66 8,62 8,554 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,80 5,75 5,665 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,56 4,50 4,406 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 3,87 3,81 3,707 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,44 3,38 3,278 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,15 3,08 2,979 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 2,94 2,86 2,7510 4,96 4,10 3,71 3,48 3,33 3,22 3,14 4,07 3,02 2,98 2,77 2,70 2,5811 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,65 2,57 2,4512 4,75 3,89 3,49 3,26 3,11 3,00 2,90 2,85 2,80 2,75 2,54 2,47 2,3413 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,46 2,38 2,2514 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,39 3,31 2,1815 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,33 2,25 2,1116 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,28 2,19 2,0617 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,23 2,15 2,0118 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,19 2,11 1,9719 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,16 2,07 1,9320 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,12 2,04 1,9021 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,10 2,01 1,8722 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,07 1,98 1,8423 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,05 1,96 1,8124 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,03 1,94 1,7930 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 1,93 1,84 1,6840 4,08 3,23 2,84 2,61 2,45 2,34 2,21 2,18 2,12 2,08 1,84 1,74 1,5860 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,75 1,65 1,47120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,66 1,55 1,35∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,57 1,46 1,22

a,, pkF

439

tabela 5 - Distribuição “F” de Snedecor para a = 1%.

kp 1 2 3 4 5 6 7 8 9 10 20 30 120

1 4052 4999 5403 5625 5764 5859 5928 5982 6022 6056 6209 6261 63392 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,45 99,47 99,493 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 26,69 26,50 26,224 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,02 13,84 13,565 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,55 9,38 9,116 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,40 7,23 6,977 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,16 5,99 5,748 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,36 5,20 4,959 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 4,81 4,65 4,40

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,41 4,25 4,0011 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,10 3,94 3,6912 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 3,86 3,70 3,4513 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,66 3,51 3,2514 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,51 3,35 3,0915 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,37 3,21 2,9616 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,26 3,10 2,8417 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,16 3,00 2,7518 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,08 2,92 2,6619 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,00 2,84 2,5820 8,10 5,35 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 2,94 2,78 2,5221 8,02 5,78 4,82 4,37 4,04 3,81 3,64 3,51 3,40 3,31 2,88 2,72 2,4622 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 2,78 2,67 2,4023 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 2,74 2,62 2,3524 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 2,70 2,58 2,3125 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,66 2,54 2,2726 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,63 2,50 2,2327 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,60 2,47 2,2028 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,57 2,44 2,1729 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,55 2,41 2,1430 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,37 2,39 2,1140 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,37 2,20 1,9260 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,20 2,03 1,73

120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,03 1,86 1,53∞ 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 1,88 1,70 1,32

a,, pkF

440

tabela 6 - Valores críticos do teste de Hartley aos níveis de 1% e 5% de probabilidade.

g: número de gruposn1 = n-1 número de graus de liberdade de cada grupoa = 5%.

gn1

2 3 4 5 6 7 8 9 10 11 12

23456789

101215203060∞

39,0015,40

9,607,155,824,994,434,033,723,282,862,462,071,671,00

87,5027,8015,5010,80

8,386,946,005,344,854,163,542,952,401,851,00

142,0039,2020,6013,7010,40

8,447,186,315,674,794,013,292,611,961,00

202,0050,7025,2016,3012,10

9,708,127,116,345,304,373,542,782,041,00

266,0062,0029,5018,7013,7010,80

9,037,806,925,724,683,762,912,111,00

333,0072,9033,6020,8015,0011,80

9,788,417,426,094,953,943,022,171,00

403,0083,5037,5022,9016,3012,7010,508,957,876,425,194,103,122,221,00

475,0093,9041,1024,7017,5013,5011,109,458,286,725,404,243,212,261,00

550,00104,0044,6026,5018,6014,3011,709,918,667,005,594,373,292,301,00

626,00114,0048,0028,2019,7015,1012,2010,309,017,255,774,493,362,331,00

704,00124,0051,4029,9020,7015,8012,7010,709,347,485,934,593,392,361,00

a = 1% gn1

2 3 4 5 6 7 8 9 10 11 12

23456789101215203060∞

199,0047,5023,2014,9011,10

8,897,506,545,854,914,073,322,631,961,00

448,085,037,022,015,512,1

9,98,57,46,14,93,83,02,21,0

729,0120,0

49,028,019,114,511,7

9,98,66,95,54,33,32,31,0

1036,0151,0

59,033,022,016,513,211,1

9,67,66,04,63,42,41,0

1362,0184,0

69,038,025,018,414,512,110,4

8,26,44,93,62,41,0

1705,0216,079,042,027,020,015,813,111,18,76,75,13,72,51,0

2063,0249,089,046,030,022,016,913,911,89,17,15,33,82,51,0

2432,0281,097,050,032,023,017,914,712,49,57,35,53,92,61,0

2813,0310,0106,054,034,024,018,915,312,99,97,55,64,02,61,0

3204,0337,0113,057,036,026,019,816,013,410,27,85,84,12,71,0

3605,0361,0120,060,037,027,021,016,613,910,68,05,94,22,71,0

441

tabela 7 - Coeficientes para interpolação de polinômios ortogonais.

3 Ocasiões 4 Ocasiões 5 Ocasiões 6 Ocasiões10 20 10 20 30 10 20 30 40 10 20 30 40 50

-10

+1

+1-2

+1

-3-1

+1+3

+1-1-1

+1

-1+3-3

+1

-2-10

+1+2

+2-1-2-1

+1

-1+20-2

+1

+1-4

+6-4

+1

-5-3-1

+1+3+5

+5-1-4-4-1

+5

-5+7+4-4-7

+5

+1-3

+2+2-3

+1

-1+5-10

+10-5

+1

7 Ocasiões 8 Ocasiões 9 Ocasiões

10 20 30 40 50 10 20 30 40 50 10 20 30 40 50

-3-2-10

+1+2+3

+50-3-4-30

+5

-1+1+10-1-1

+1

+3-7

+1+6+1-7

+3

-1+4-50

+5-4

+1

-7-5-3-1

+1+3+5+7

+7+1-3-5-5-3

+1+7

-7+5+7+3-3-7-5

+7

+7-13-3

+9+9-3-13+7

-7+23-17-15

+15+17-23+7

-4-3-2-10

+1+2+3+4

+28+7-8-17-20-17-8

+7+28

-14+7+13+90-9-13-7

+14

+14-21-11+9+18+9-11-21

+14

-4+11

-4-90

+9+4-11+4

10 Ocasiões 11 Ocasiões

10 20 30 40 50 10 20 30 40 50

-9-7-5-3-1

+1+3+5+7+9

+6+2-1-3-4-4-3-1

+2+6

-42+14+35+31+12-12-31-35-14

+42

+18-22-17+3+18+18+3-17-22

+18

-6+14

-1-11-6

+6+11+1-14+6

-5-4-3-2-10

+1+2+3+4+5

+15+6-1-6-9-10-9-6-1

+6+15

-30+6+22+23+14

0-14-23-22-6

+30

+6-6-6-1

+4+6+4-1-6-6

+6

-3+6+1-4-40

+4+4-1-6

+3

AmostrAgem em InventárIo FlorestAl

Documents

Transcript of AmostrAgem em InventárIo FlorestAl