ECONOMETRIA - pmbortolon.wikispaces.com 1...O método Econométrico 3. Especificação do modelo...

Post on 28-May-2018

216 views 1 download

Transcript of ECONOMETRIA - pmbortolon.wikispaces.com 1...O método Econométrico 3. Especificação do modelo...

ECONOMETRIA

Prof. Patricia Maria Bortolon, D. Sc.

Introdução

Teoria Econômica

Matemática

Fenômenos Econômicos

Inferência Estatística

Teoria Econômica

Teoria Microeconômica

Preço

Demanda

Mas quanto????

Teoria Econômica

Economia Matemática

• Formula equações sem levar em conta se a teoria pode ser medida ou verificada

Estatística Econômica

• Coleta, processamento e apresentação dos dados

Estatística Matemática

• Ferramentas específicas para lidar com dados que não foram gerados por experimentos controlados

O método Econométrico

1. Exposição da teoria ou hipótese

– Keynes: o aumento da renda eleva o consumo, mas não em

proporção igual ao aumento dessa renda.

– Propensão marginal a consumir (PMC) > 0, mas < 1

2. Especificação do modelo matemático da teoria

– Um economista matemático poderia sugerir:

Y

X

Despesa de

consumo

Renda

β1

β2= PMC

consumo

Inclinação = PMC

renda

O método Econométrico

3. Especificação do modelo estatístico ou econométrico

– Se obtivéssemos dados de 500 famílias (consumo e renda) e

plotássemos os pontos no gráfico, todos cairiam em cima da

reta?

– Não. Por que?

– Porque provavelmente outros fatores afetam a decisão de

consumo (tamanho da família, cultura, religião etc...)

– A função definida pelo economista matemático é

determinística

– Para dar conta das relações inexatas o econometrista

escreve:

Modelo

Econométrico

Distúrbio

Termo de erro

Var. aleatória (estocástica)

Representa todos os fatores

que afetam o consumo

mas não são levados

em conta explicitamente

O método Econométrico

4. Obtenção dos dados

Y

X

u

O método Econométrico

5. Estimação dos parâmetros do modelo econométrico

– Vai dar conteúdo empírico à função consumo

– Análise de regressão

– Aumento de US$1 no período amostrado, provoca em

média, um aumento no consumo de US$0,70

– Por que dizemos “em média”? Porque a relação é inexata.

^ indica se tratar de uma estimativa

O método Econométrico

6. Testes de hipóteses

– Keynes: esperava que PMC fosse + e < 1

– Mas, 0,70 é estatisticamente menor que 1?

– 0,70 está suficientemente abaixo de 1, ou é um resultado devido ao

acaso?

7. Projeção ou previsão

– Uma redução de impostos => aumento da renda das famílias => quanto

aumentará o consumo?

8. Uso do modelo para fins de controle ou de política

– Se certo nível de consumo garante certo nível de desemprego a relação

calculada pode ser usada no sentido inverso para descobrir qual o nível

de renda necessário. Políticas podem ser estabelecidas para atingir esse

nível de geração de renda.

Capítulo 1

A natureza da análise de regressão

Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.

Rio de Janeiro. Elsevier- Campus, 2006

Origem Histórica

• Altura de filhos de pais altos e de pais baixos tendem

para a altura média da população

• Lei da regressão universal de Galton

• Confirmada por Karl Pearson

• “regressão a mediocridade”

Interpretação moderna da regressão

• Descobrir como a altura média dos filhos varia, dada a

altura dos pais

• Estudo do comportamento de uma variável dependente

em relação a uma ou mais variáveis explanatórias, para

estimar ou prever o valor (médio) da população da

primeira em termos dos valores conhecidos ou fixados

(em amostras repetidas) das segundas.

Ver figura 1.1 e exemplos da página 14 a 16

Relações Estatísticas x Determinísticas

• Determinística (ou funcional)

– Lei da gravitação de Newton

• Estatísticas

– Rendimento das lavouras = f (temperatura, pluviosidade, luz solar,

fertilizantes)

– Um agrônomo consegue prever com exatidão o rendimento se ele

conhecer os valores das variáves à direita da equação?

– Não. Por que?

• Erros de medição

• Influência de outros fatores

– Há uma variabilidade “intrínseca” ou aleatória

Regressão x Causação

• Kendall e Stuart: as ideias de causação devem se

originar de alguma teoria

• Rendimento causa chuva ou chuva causa rendimento?

• O que o faz acreditar na segunda?

– Senso comum

– Não poder controlar a pluviosidade por meio de uma variação

no rendimento da lavoura

• Relação estatística não implica logicamente causação

• A causação irá depender de considerações a priori ou

teóricas

Regressão x Correlação

• Correlação

– Não há diferença entre variável dependente e explanatória

– As duas variáveis são aleatória

– Correlação entre notas de estatística e matemática

• Regressão

– Há uma assimetria no tratamento das variáveis

• Dependente: estatística, aleatória, estocástica, tem distribuição de

probabilidade

• Independente: tem valores fixos em amostras repetidas (ex: alturas)

Mede a força ou grau

de associação linear

entre duas variáveis

Tentamos prever o

valor médio de uma

variável com base nos valores

fixos de outras variáveis

Terminologia e Notação

• Ver quadro da pag. 18

• Análise de regressão simples:

• Análise de regressão múltipla:

Terminologia e Notação

• Variável aleatória: (ou estocástica) – aquela que pode

assumir qualquer valor, + ou - , dentro de um conjunto

de valores com uma dada probabilidade.

Y Variável dependente

Xk Variável explicativa (X1, X2, ... , Xk)

NNo. total de observações na população

T

nNo. total de observações na amostra

t

iSubscrito – dados de corte transversal, coletados em

um ponto no tempo

tSubscrito – dados de séries temporais, coletados ao

longo de um intervalo de tempo

Tipos de Dados

• Séries Temporais

– A variável assume valores em diferentes momentos do tempo

– Cotações intra-diárias de ações, receitas mensais, lucros

anuais

– Estacionária: quando a média e a variância não variam

sistematicamente ao longo do tempo

• Corte Transversal

– Variáveis coletadas em um mesmo momento no tempo

– Lucro líquido das empresas siderúrgicas em 2010

– Heterogeneidade pode ser um problema (ver tab. 1.1 e fig.

1.6)

Tipos de Dados

• Dados combinados

– Ver tab. 1.2 do exercício 1.1

– O IPC de cada país no período 73-97 é uma série temporal

– Os dados dos 7 países em cada ano é um corte transversal

• Dados em painel (longitudinais ou de micropainel)

– Uma mesma unidade em corte transversal é pesquisada ao

longo do tempo

Fontes de Dados

• Economática

• Thomson Reuters

• CVM

• BM&FBovespa

• IBGE

• Banco Central

• Sites de empresas

Exatidão dos Dados

• A maioria dos dados não são experimentais por

natureza, há possibilidade de erros de observação,

intencionais ou não

• Mesmo em dados experimentais: erros de medição

• Questionários: 40% de resposta – viés de seletividade

“Os resultados de sua pesquisa terão a mesma

qualidade dos dados coletados”

Escalas de Medição das Variáveis

• Escala nominal

– Sexo, estado civil

– Para associar observações a categorias específicas

• Escala ordinal

– Classe de renda, nível educacional

– É possível ordenar

• Escala de intervalo

– É possível ordenar e comparar

– Os intervalos são iguais

– Ex.: latitude e longitude

• Escala de razão

– A razão (X1/X2) e a distância (X1 – X2) são significativas

– É possível ordenar

– É possível comparar

– Tem um zero real

Stevens (1946)

Stevens (1946)

Capítulo 2 – Análise de Regressão com

Duas Variáveis

Algumas ideias básicas

Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.

Rio de Janeiro. Elsevier- Campus, 2006

Tabela 2.1

• Grupos de renda => valores fixos de X

• Y varia para cada valor fixo de X

• O valor médio de Y aumenta com o aumento da renda

– Para a renda mensal de $80 => consumo médio de $65

– São 10 valores médios para as 10 classes de renda

Valores esperados condicionais

E(Y | X)

Tabela 2.1

• Valor esperado incondicional

– E(Y) = soma dos 60 dados de consumo dividido por 60

– Incondicional pois não leva em consideração os diferentes

níveis de renda

“Qual o valor esperado das despesas de consumo semanais médias

de uma família?”

“Qual o valor esperado das despesas de consumo semanais de uma

família cuja renda mensal é, digamos, de $140?”

$ 121,20

$ 101

LRP

• LRP = Linha de Regressão Populacional

Uma curva de regressão populacional é o lugar geométrico das

médias condicionais da variável dependente para os valores

fixados da variável explanatória.

Ver fig. 2.2

Conceito de Regressão Populacional

Cada média condicional E(Y | Xi) é uma função de Xi,

onde Xi é um dado valor de X.

E(Y | Xi) = f(Xi) :função de esperança condicional FEC

:função de regressão populacional FRP

Qual a forma assumida pela função f(Xi)?

Conceito de Regressão Populacional

Qual a forma assumida pela função f(Xi)?

interceptocoeficiente angular

Parâmetros desconhecidos, mas fixos

Função de regressão populacional

Modelo de regressão populacional

Regressão linear populacional

O significado do termo LINEAR

São lineares nos

parâmetros

O significado do termo LINEAR

O significado do termo LINEAR

• A linearidade relevante para a teoria da regressão é a

nos parâmetros

Linear nos

parâmetros?

Linear nas variáveis?

Sim Não

Sim MRL MRL

Não MRNL MRNL

Especificação estocástica da FRP

• O que podemos dizer sobre os gastos de consumo de

uma dada família e um dado nível de renda?

Yi = E(Y|Xi) + ui

ui = Yi – E(Y|Xi)

- Desvio de um Yi individual em torno de seu valor

esperado

- Distúrbio estocástico

- Termo de erro estocástico

(1)

Especificação estocástica da FRP

Yi = E(Y|Xi) + ui(1)

Gasto médio de consumo

de todas as famílias com

a mesma renda

= elemento sistemático ou

determinístico

Elemento aleatório ou não

sistemático = representa (é uma

proxy) de todas as variáveis

omitidas ou negligenciadas que

podem afetar Y mas não foram

incluídas nos modelos de

Regressão.

Especificação estocástica da FRP

Yi = E(Y|Xi) + ui

E(Yi|Xi) = E[E(Y|Xi)] + E(ui|Xi)

=> E(ui|Xi) = 0=

A pressuposição de que a linha de regressão passa pelas médias

condicionais de Y => que os valores médios condicionais de ui

(condicionais a um dado X) são iguais a zero.

O significado do termo de erro estocástico

• Caráter vago da teoria

– ui é um substituto para todas as variáveis excluídas ou

omitidas do modelo

• Falta de dados disponíveis

– Ex.: no caso do consumo, a riqueza das famílias

• Variáveis essenciais x variáveis periféricas (com pouca

influência)

• Caráter intrinsicamente aleatório do comportamento

humano

• Variáveis proxy pouco adequadas

– Ex.: endividamento, valor de mercado

O significado do termo de erro estocástico

• Princípio da parcimônia

– Navalha de Occam: o modelo de regressão deve ser o mais

simples possível

• Forma funcional equivocada

– Quando é possível inferir a forma funcional a partir de um

gráfico => só no modelo de regressão linear simples

Função de Regressão Amostral

Estimador de β2

Estimador de β1

Estimador de E(Y|Xi)

Estimador = estatística (amostral) = estimativa

Forma Estocástica da FRA

Estimador de ui

Capítulo 3 – Modelo de Regressão de

Duas Variáveis

O Problema da Estimação

Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.

Rio de Janeiro. Elsevier- Campus, 2006

Método dos Mínimos Quadrados

Ordinários - MQO

• Recordemos a FRP de duas variáveis:

𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖

• Como esta não pode ser observada diretamente, temos

que estimá-la a partir da FRA:

𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖

= 𝑌𝑖 + 𝑢𝑖

• Podemos escrevê-la da seguinte forma:

𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖

= 𝑌𝑖 − 𝛽1 + 𝛽2𝑋𝑖

• E agora?

Método dos Mínimos Quadrados

Ordinários - MQO

• 1ª. sugestão: escolher a FRA tal que 𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖

– Problema: a soma algébrica pode resultar em valor muito

pequeno ou zero, mesmo que os pontos estejam muito

dispersos em torno da reta ajustada (ver fig. 3.1)

• 2ª. sugestão: usar 𝑢𝑖2 = 𝑌𝑖 − 𝑌𝑖

2

= 𝑌𝑖 − 𝛽1 + 𝛽2𝑋𝑖2

𝑢𝑖2 = 𝑓 𝛽1, 𝛽2

Método dos Mínimos Quadrados

Ordinários - MQO

𝑢𝑖2 = 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖

2

𝜕 𝑢𝑖2

𝜕 𝛽1

= −2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 = 0

𝜕 𝑢𝑖2

𝜕 𝛽2

= −2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 𝑋𝑖 = 0

(1)

(2)

(1) e (2) são as Equações Normais

Método dos Mínimos Quadrados

Ordinários - MQO

• Resolvendo o sistema de equações:

𝛽2 = 𝑋𝑖 − 𝑋 𝑌𝑖 − 𝑌

𝑋𝑖 − 𝑋 2=

𝑥𝑖𝑦𝑖

𝑥𝑖2

𝛽1 = 𝑌 − 𝛽2 𝑋

MQO – Propriedades Numéricas

Obs.: não dependem da forma como os dados são gerados

I. São calculados a partir de quantidades observáveis

(isto é, amostrais)

II. São estimadores pontuais

III. Obtidos os estimadores, a linha de regressão pode ser

facilmente obtida. A linha de regressão tem as

seguintes propriedades:

Propriedades da Linha de Regressão

1. Passa pelas médias amostrais 𝑋 e 𝑌 e pode ser escrita

como 𝑌 = 𝛽1 + 𝛽2 𝑋

2. O valor médio dos Y estimados é igual ao valor médio

dos Y observados 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 𝑌𝑖 = 𝑌 − 𝛽2

𝑋1

+ 𝛽2𝑋𝑖

𝑌𝑖 = 𝑌 − 𝛽2 𝑋𝑖 − 𝛽2 𝑋 aplicando o somatório

e dividindo por n

𝑌𝑖

𝑛=

𝑌

𝑛− 𝛽2 𝑋𝑖 − 𝑋

𝑌 = 𝑌

Propriedades da Linha de Regressão

3. O valor médio dos resíduos é igual a zero

Da primeira equação normal:

−2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 = 0

−2 𝑢𝑖 = 0 𝑢 = 0

Por causa disso a FRA pode ser escrita na forma de

desvios em relação à média:

1º - aplicando somatório em 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖 (1)

𝑌𝑖

𝑖

= 𝑛 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖

0

Propriedades da Linha de Regressão

2º - dividindo por n

𝑌 = 𝛽1 + 𝛽2 𝑋 (2)

3º. – fazendo (1) em (2)

𝑌𝑖 − 𝑌 = 𝛽2 𝑋𝑖 − 𝑋 + 𝑢𝑖 ou

𝑦𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖 <= formato de desvio 𝛽1 não aparece

FRA: 𝑦𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖

Propriedades da Linha de Regressão

4º - 𝑢𝑖 não são correlacionados com 𝑌𝑖

A partir do formato de desvio:

𝑦𝑖 = 𝛽2𝑥𝑖 (x 𝑢𝑖) e somatório

𝑦𝑖 𝑢𝑖 = 𝛽2 𝑥𝑖 𝑦𝑖 − 𝛽2𝑥𝑖

𝑦𝑖 𝑢𝑖 = 𝛽2 𝑥𝑖𝑦𝑖 − 𝛽22 𝑥𝑖

2 mas 𝛽2 = 𝑥𝑖𝑦𝑖

𝑥𝑖2

𝑦𝑖 𝑢𝑖 = 𝛽22 𝑥𝑖

2 − 𝛽22 𝑥𝑖

2

𝑦𝑖 𝑢𝑖 = 0 𝑌𝑖 − 𝑌 𝑢𝑖 = 0 é a covariância de 𝑌𝑖 com

𝑢𝑖

Propriedades da Linha de Regressão

4º - 𝑢𝑖 não são correlacionados com 𝑋𝑖, isto é, 𝑢𝑖𝑋𝑖 = 0

Da 2ª. Equação normal:

−2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 𝑋𝑖 = 0

𝑢𝑖

Premissas subjacentes ao MQO

• Necessárias para que possamos fazer inferências

MLRC – Modelo de Regressão Linear Clássico

Premissa 1: o modelo de regressão é linear nos

parâmetros

Premissa 2: os valores de X são fixos em amostras

repetidas, ou seja, X é não estocástico. Nossa análise de

regressão é condicional aos valores de X.

Premissa 3: o valor médio do termo de erro ui é zero.

E(ui|Xi) = 0

Os fatores implícitos que afetam ui não afetam

sistematicamente o valor médio de Y.

Premissas subjacentes ao MQO

MLRC – Modelo de Regressão Linear Clássico

Se E(ui|Xi) = γ temos um problema de identificação:

E(Yi|Xi) = β1 + β2Xi + ui

E[E(Yi|Xi)] = E(β1|Xi)+ E(β2Xi|Xi)+ E(ui|Xi)

E(Yi|Xi) = β1 + β2Xi + γ

E(Yi|Xi) = (β1 + γ) + β2Xi

E(Yi|Xi) = β’1 + β2Xi

Ao estimar esse modelo obtemos infinitas soluções para

β1 e γ

Premissas subjacentes ao MQO

MLRC – Modelo de Regressão Linear Clássico

Premissa 4: homocedasticidade de ui

Var(ui|Xi) = E[ui – E(ui|Xi)]2

Var(ui|Xi) = σ2

Se for heterocedástico => 𝑉𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝜎𝑖2

As variâncias condicionais de Yi também são

homocedásticas.

Var(Yi|Xi) = σ2

Premissas subjacentes ao MQO

MLRC – Modelo de Regressão Linear Clássico

Premissa 5: não há autocorrelação entre os termos de

erro

𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 = 0 ∀ 𝑖 ≠ 𝑗

Premissa 6: covariância entre ui e Xi é igual a zero

𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 0 𝐸 𝑢𝑖𝑋𝑖 = 0

– Se X é não estocástico essa premissa é satisfeita automaticamente, uma vez

que nesse caso a covariâcia entre o erro e X é necessariamente zero.

– Importante para que se possa avaliar o efeito isolado de X sobre Y.

– Importante porque se X forem aleatórios ainda assim a teoria da regressão

será aplicável desde que os X não sejam correlacionados com os termos de

erro.

Premissas subjacentes ao MQO

MLRC – Modelo de Regressão Linear Clássico

Premissa 7: n deve ser maior que o número de

parâmetros a serem estimados

Premissa 8: variabilidade dos valores de X – “as

variáveis precisam variar”

𝛽2 = 𝑥𝑖𝑦𝑖

𝑥𝑖2

Premissa 9: o modelo de regressão está especificado na

forma correta (ver eq. 3.2.7 e 3.2.8 e fig. 3.7)

Premissa 10: (para modelos com mais de 2 variáveis) não

há relações lineares perfeitas entre as variáveis

explanatórias

Precisão ou erros-padrão das estimativas

MQO

𝑣𝑎𝑟 𝛽2 =𝜎2

𝑥𝑖2 𝑣𝑎𝑟 𝛽1 =

𝑋𝑖2

𝑛 𝑥𝑖2 𝜎2

Onde 𝜎2 é a variância homocedástica de ui

Obs.:

‒ Quanto maior a variação nos valores de Xi maior a

precisão da estimativa de 𝛽2

‒ Com o aumento de n também aumenta a precisão

Precisão ou erros-padrão das estimativas

MQO

Se 𝜎2 é desconhecido pode ser estimado por

𝜎2 = 𝑢𝑖

2

𝑛 − 2 𝑢𝑖

2= SQR = soma dos quadrados dos resíduos

𝜎 = 𝑢𝑖

2

𝑛 − 2

É o erro padrão da estimativa, é o desvio padrão dos

valores de Y em relação à linha de regressão. Uma

medida da “qualidade do ajustamento”.

Teorema de Gauss-Markov

• 𝛽2 é dito o melhor estimador linear não tendencioso de

β2 se:

1. É linear, por exemplo, em Y

2. É não tendencioso => E( 𝛽2) = β2

3. É eficiente, ou seja, entre todos os estimadores lineares é o

de menor variância (ver fig. 3.8)

Ver propriedades dos estimadores na pag. 723

Qualidade do ajustamento• r2 no caso de regressão com duas variáveis

• R2 no caso de regressão múltipla = coeficiente de determinação

Xi

Y

X

Yi

STQ = (Yi - Y)2

SQR = (Yi - Yi )2

SQReg = (Yi - Y)2

_

_

_

Y

Y

Y_Y

Qualidade do Ajustamento

𝑌𝑖 = 𝑌𝑖 + 𝑢𝑖

(𝑌𝑖 − 𝑌)2= ( 𝑌𝑖 − 𝑌)2+(𝑌𝑖 − 𝑌𝑖)2

𝑆𝑇𝑄 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅 ÷ 𝑆𝑇𝑄

1 =𝑆𝑄𝐸

𝑆𝑇𝑄+

𝑆𝑄𝑅

𝑆𝑇𝑄

1 = 𝑟2 +𝑆𝑄𝑅

𝑆𝑇𝑄

𝑟2 =𝑆𝑄𝐸

𝑆𝑇𝑄=

( 𝑌𝑖 − 𝑌)2

(𝑌𝑖 − 𝑌)2

= (𝑌𝑖 − 𝑌𝑖)

2

(𝑌𝑖 − 𝑌)2=

𝑢𝑖2

(𝑌𝑖 − 𝑌)2

Qualidade do Ajustamento

𝑟2 = 1 −𝑆𝑄𝑅

𝑆𝑇𝑄

• Mede a proporção ou percentual da variação total de Y

explicada pelo modelo de regressão

• No modelo de regressão linear simples, o R2 é igual ao

quadrado do coeficiente de correlação entre X e Y

𝑟2 = 𝑟𝑥𝑦2

Coeficiente de determinação amostral

Qualidade do Ajustamento

• No modelo de regressão linear simples, o R2 é igual ao

quadrado do coeficiente de correlação entre X e Y

𝑟2 = 𝑟𝑥𝑦2

0 ≤ 𝑟2 ≤ 1

Ajuste perfeito 𝑌𝑖 = 𝑌𝑖

Sem relação linear

entre Y e X 𝑌𝑖 = 𝑌

Coeficiente de Correlação Amostral - r

1. Pode ser + ou –

2. −1 ≤ r ≤ 1

3. Simétrica 𝑟𝑥𝑦 = 𝑟𝑦𝑥

4. Independe da escala

𝑟𝑥𝑦 = 𝑟𝑥∗𝑦∗ onde 𝑋𝑖∗ = 𝑎𝑋𝑖 + 𝑐 e 𝑌𝑖

∗ = 𝑏𝑌𝑖 + 𝑑

5. Se X e Y são independentes rxy = 0

mas rxy = 0 não implica independência

5. Não implica relação de causa e efeito

6. Não tem sentido para descrever relações não lineares

Capítulo 4 – Modelo Normal de

Regressão Linear Clássico

MNRLC

Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.

Rio de Janeiro. Elsevier- Campus, 2006

Até aqui...

• Com o auxílio do método MQO conseguimos estimar

β1, β2, σ2.

• Sob as premissas do MRLC vimos que os estimadores

desses parâmetros 𝛽1, 𝛽2 e 𝜎2 apresentam propriedades

estatísticas desejáveis tais como não tendenciosidade,

variância mínima etc...

• Falta agora fazer os testes de hipóteses necessários às

inferências sobre a FRP.

• Quão longe 𝛽1, 𝛽2 e 𝜎2 estão dos parâmetros

populacionais β1, β2, σ2?

• Para isso precisamos descobrir as distribuições de

probabilidade de 𝛽1, 𝛽2 e 𝜎2.

𝛽2 = 𝑥𝑖𝑦𝑖

𝑥𝑖2

Do numerador:

𝑥𝑖𝑦𝑖 = 𝑥𝑖 𝑌𝑖 − 𝑌 = 𝑥𝑖𝑌𝑖 − 𝑌 𝑥𝑖

= 𝑥𝑖𝑌𝑖 − 𝑌 𝑋𝑖 − 𝑋

= 𝑥𝑖𝑌𝑖

Daí: 𝛽2 = 𝑥𝑖𝑦𝑖

𝑥𝑖2 =

𝑥𝑖𝑌𝑖

𝑥𝑖2 = 𝑘. 𝑌𝑖

• Como pressupomos que X é não estocástico, nossa

análise de regressão é condicionada aos valores fixos de

Xi.

• 𝛽2 é uma função linear de Yi

𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖

𝛽2 = 𝑘 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖

• Mas Xi é não estocástico, então a variação de 𝛽2 vai

depender da variação de ui

• Como o MQO não faz qualquer pressuposição sobre a

natureza probabilística de ui, não nos ajuda a fazer

inferências a respeito da FRP a partir da FRA.

A premissa de normalidade de ui

• Normalidade de ui => MNRLC

𝑢𝑖~𝑁 0, 𝜎2

Média: E(ui) = 0

Variância: 𝐸 𝑢𝑖 − 𝐸(𝑢𝑖)2 = 𝐸 𝑢𝑖

2 = 𝜎2

Covariância: 𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 : 𝐸 𝑢𝑖 , 𝑢𝑗 = 0 ∀𝑖 ≠ 𝑗

𝑢𝑖 e 𝑢𝑗 se distribuem independentemente

𝑢𝑖~𝑁𝐼𝐷 0, 𝜎2

Distribuído de maneira normal e independente

Por que a premissa de normalidade?

1. Porque como 𝛽1 e 𝛽2 são funções lineares de 𝑢𝑖 se 𝑢𝑖

estiver normalmente distribuído 𝛽1 e 𝛽2 também

estarão.

• Esperamos que 𝑢𝑖 seja resultado da influência de variáveis

omitidas ou negligenciadas e que esse efeito seja pequeno e

aleatório.

• Pelo Teorema do Limite Central a soma de um grande

número de variáveis aleatórias, independentes e com

distribuição idêntica, tende à distribuição normal.

• Propriedade da distribuição Normal: qualquer função linear

de variáveis com distribuição normal também é normalmente

distribuída.

Por que a premissa de normalidade?

2. A distribuição normal é simples, envolve 2 parâmetros

3. Para amostras menores que 100 elementos a premissa

de normalidade é fundamental. Permite recorrer aos

testes t, F e χ2.

• Se o tamanho da amostra for suficientemente grande

podemos relaxar a premissa de normalidade;

• Para amostras pequenas cabe verificar se a premissa é

adequada.

Propriedades dos estimadores de MQO sob a

premissa de normalidade

1. São não tendenciosos.

2. São eficientes – têm variância mínima.

3. São consistentes – à medida que n aumenta

indefinidamente, os estimadores convergem para os

verdadeiros valores da população.

4. 𝛽1~𝑁(𝛽1, 𝜎 𝛽1

2 ) onde 𝜎 𝛽1

2 = 𝑋𝑖

2

𝑛 𝑥𝑖2 𝜎2

5. 𝛽2~𝑁(𝛽2, 𝜎 𝛽2

2 ) onde 𝜎 𝛽2

2 =𝜎2

𝑥𝑖2

6. (𝑛 − 2) 𝜎2

𝜎2 ~χ𝑛−22

Propriedades dos estimadores de MQO sob a

premissa de normalidade

7. A distribuição de ( 𝛽1 , 𝛽2) é independente de 𝜎2.

8. 𝛽1 e 𝛽2 têm a variância mínima dentro de toda a classe

de estimadores não tendenciosos, sejam lineares ou

não lineares – são BUE.