Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade...
Transcript of Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade...
![Page 1: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/1.jpg)
Análise da Regressão múltipla: MQO Assintótico
Capítulo 5 do WooldridgeCapítulo 5 do Wooldridge
![Page 2: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/2.jpg)
Análise da Regressão múltipla: MQO Assintótico
y = β + β x + β x + . . . β x + uy = β0 + β1x1 + β2x2 + . . . βkxk + u
3. Propriedades assintóticasAntes, propriedades sobre amostras finitas de tamanho n
![Page 3: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/3.jpg)
Inferência em grandes amostras
Lembre-se que sob as hipóteses do MLC, as distribuições amostrais são normais, o que nos permite derivar as distribuições t e F nos testes de hipóteses.
3
testes de hipóteses.Essa normalidade exata vem da hipótese de os erros terem distribuição normal.Essa hipótese de erros normais implica que a distribuição de y, dados x’s, também é normal.
![Page 4: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/4.jpg)
Inferência em grandes amostras (cont.)
Observamos y e podemos identificar que existem muitos exemplos em que a normalidade não é verdadeira.Uma variável aleatória y que tenha distribuição normal deverá ter distribuição
4
distribuição normal deverá ter distribuição simétrica em torno de sua média.Qualquer variável assimétrica, como salários, detenções, poupança etc. não podem ser normais pois a normal é simétrica.
![Page 5: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/5.jpg)
Inferência em grandes amostras (cont.)
Exemplo: Modelo que explica a taxa de participação nos planos de pensão dos EUA.
5
Variável dependente y: prateAnálise da variável dependente no gretl- Histograma - Estatísticas descritivas
![Page 6: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/6.jpg)
Ver: estatísticas descritivas
Estatísticas Descritivas, usando as observações 1 - 1534para a variável 'prate' (1534 observações
válidas)
Média 87,363
6
Média 87,363 Mediana 95,700 Mínimo 3,0000 Máximo 100,00 Desvio padrão 16,717 C.V. 0,19135 Enviesamento -1,5196 Curtose Ex. 2,2584
![Page 7: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/7.jpg)
Histograma de prate (variável, gráfico de frequência simples)
0.4
0.5
Fre
qu
ën
cia
re
lati
va
7 0
0.1
0.2
0.3
0 20 40 60 80 100
Fre
qu
ën
cia
re
lati
va
prate
![Page 8: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/8.jpg)
Histograma de prate (variável, gráfico de frequência simples)
0.1
0.12
0.14prate
N(87,363 16,717)Estatística de teste para normalidade:
Qui-quadrado(2) = 1159,437 p-valor = 0,00000
8 0
0.02
0.04
0.06
0.08
0 20 40 60 80 100 120 140
De
nsid
ad
e
![Page 9: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/9.jpg)
Inferência em grandes amostras (cont.)
A normalidade não é necessária para que MQO seja BLUE; ela é necessária apenas para inferência.No exemplo demonstrado, devemos
9
No exemplo demonstrado, devemos abandonar as estatísticas t para determinar quais variáveis são estatisticamente significantes???NÃO!!!
![Page 10: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/10.jpg)
Teorema do Limite Central
Baseado no teorema do limite central,
podemos mostrar que os estimadores de MQO
são assintoticamente normais.
Ou seja, para amostras grandes, eles seguem
10
Ou seja, para amostras grandes, eles seguem
uma distribuição normal aproximada.
A normalidade assintótica implica que
P(Z<z)→Φ(z) quando n →∞, ou seja, que
P(Z<z) ≈ Φ(z)
![Page 11: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/11.jpg)
Teorema do Limite Central
O teorema central do limite diz que a
média amostral padronizada de qualquer
população com média µ e variância σ2 é
assintoticamente ~N(0,1), ou:
11
assintoticamente ~N(0,1), ou:
( )1,0~ N
n
YZ
aY
σµ−
=
![Page 12: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/12.jpg)
Normalidade assintótica
( ) ( )( )
,,0Normal ~ˆ (i)
Markov,-Gauss de hipóteses as Sob
22j
a
jj an σββ −
∑
12
( )
( ) ( ) ( )1,0Normal ~ˆˆ (iii)
de econsistentestimador um é ˆ (ii)
ˆplim onde
22
212
a
jjj
ijj
ep
rna
βββ
σσ
−
= ∑−
![Page 13: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/13.jpg)
Normalidade assintótica(cont.)
Como a distribuição t se aproxima da normal, dizemos que:
( ) ( )~ˆˆ −a
tep βββ
13
( ) ( ) 1~ˆˆ−−− kn
a
jjj tep βββ
Observe que, enquanto não precisamos assumir normalidade se a amostra for grande, ainda precisamos da hipótese de homocedasticidade e de média
condicional zero.
![Page 14: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/14.jpg)
Como é feita a inferência??Os testes t e a construção dos intervalos de confiança são realizados exatamente damesma forma anterior, quandoconsiderávamos as hipóteses do ModeloLinear Clássico.
14
Linear Clássico.
( ) ( ) 1~ˆˆ−−− kn
a
jjj tep βββ
![Page 15: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/15.jpg)
Como decidir se o seu tamanho de amostra é suficiente??
Se o tamanho da amostra é grande (pelo menos1500 observações, p.e.), isto é suficiente parausarmos o Teorema do limite central.Alguns econometristas acham que n = 30 é um tamanho satisfatório.
15
tamanho satisfatório.A qualidade da aproximação também dependedos graus de liberdade.Com mais variáveis independentes no modelo, um tamanho da amostra maior é usualmentenecessário para usar a aproximação t.
![Page 16: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/16.jpg)
Outra estatística: estatística do multiplicador de Lagrange (LM)
Uma vez que estamos usando grandes amostras e a normalidade assintótica para inferência, podemos utilizar mais que as estatísticas t e F.A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as
16
A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as restrições múltiplas de exclusão.Também chamada de estatística de escore.A estatística LM também é chamada de estatística nR2.
![Page 17: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/17.jpg)
Estatística LM (cont)Suponha que tenhamos o modelo
y = β0 + β1x1 + β2x2 + . . . βkxk + u
A hipótese nula seja:
17
A hipótese nula seja:H0: βk-q+1 = 0, ... , βk = 0
q restrições de exclusão no modelo
A estatística LM existe apenas a estimação do modelo restrito
![Page 18: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/18.jpg)
Estatística LM (cont)
~~...
~~110 qkqk uxxy ++++= −−βββ
18
regressão. desta é onde ,
) variáveisas todasm (i.e., ,...,, em ~de regressão a faça e ,~ resíduos, os pegue Agora,
22
21
uu
k
RnRLM
exxxu
u
=
![Page 19: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/19.jpg)
Estatística LM (cont)
Se as variáveis omitidas tiverem realmente coeficientes populacionais iguais a zero, então o resíduo encontrado deve ser pelo menos não correlacionado com cada uma dessas variáveis
19
correlacionado com cada uma dessas variáveis excluídas.Ou seja, o deve estar próximo de zero.Como determinar quando a estatística é suficientemente grande para rejeitar a hipótese nula a um nível de significância escolhido?
2uR
![Page 20: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/20.jpg)
Estatística LM (cont)
2
2
2~
q
q
q
a
de value-p o calcular apenas
ou , ãodistribuiç uma de ,c crítico valor
o escolher podemos então ;LM
χ
χ
χ
20
q de value-p o calcular apenas χ
Com uma amostra grande, o resultado dos testes F e LM devem ser similares.
![Page 21: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/21.jpg)
Estatística LM: exemploModelo do crime (banco de dados: crime1.raw, dados de 2.725 homens nascidos em 1960 ou 1961 na Califórnia):
Variável dependente: narr86 – número de vezes que um homem foi preso
Variáveis independentes:- pcnv: proporção de prisões anteriores que levaram à
21
- pcnv: proporção de prisões anteriores que levaram à condenação.
- avgsen: sentença média cumprida de condenaçõespassadas.
- tottime: tempo total que o homem passou na prisão em1986 desde que atingiu a idade de 18 anos.
- Ptime86: meses passados na prisão em 1986.- qemp86: número de trimestres, em 1986, durante os quaiso homem esteve legalmente empregado.
![Page 22: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/22.jpg)
Estatística LM: exemploTeste: Testar a hipótese nula de que avgsen e tottime não possuem efeito sobre narr86, dado que todos demais fatores foram controlados.
Ho: β2=β3=0
22
Ho: β2=β3=0
Passo 1: estimar a regressão sem estas variáveis.
Passo 2: regredir os resíduos desta regressão em todas variáveis independentes.
![Page 23: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/23.jpg)
Modelo irrestrito
uqemptime
tottimeavgsenpcnvnarr
+++
++++=
86.86.
...86
54
3210
ββ
ββββ
Modelo 1: Estimativas OLS usando as 2725 observações 1-2725
Variável dependente: narr86
Variável Coeficiente Erro Padrão estatística-t p-valor
const 0,706061 0,0331524 21,2974 <0,00001 ***
pcnv -0,151225 0,040855 -3,7015 0,00022 ***
23
avgsen -0,00704866 0,0124122 -0,5679 0,57016
tottime 0,0120953 0,00957684 1,2630 0,20671
ptime86 -0,0392585 0,00891659 -4,4029 0,00001 ***
qemp86 -0,103091 0,0103972 -9,9152 <0,00001 ***
Média da variável dependente = 0,404404
Desvio padrão da variável dependente = 0,859077
Soma dos resíduos quadrados = 1924,39
Erro padrão dos resíduos = 0,841284
R2 não-ajustado = 0,0427554
R2 ajustado = 0,0409951
Estatística-F (5, 2719) = 24,2889 (p-valor < 0,00001)
![Page 24: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/24.jpg)
Modelo restrito (passo 1)uqemptimepcnvnarr ++++= 86.86..86 5410 ββββ
Modelo 2: Estimativas OLS usando as 2725 observações 1-2725
Variável dependente: narr86
Variável Coeficiente Erro Padrão estatística-t p-valor
const 0,711772 0,0330066 21,5645 <0,00001 ***
pcnv -0,149927 0,0408653 -3,6688 0,00025 ***
24
pcnv -0,149927 0,0408653 -3,6688 0,00025 ***
ptime86 -0,0344199 0,008591 -4,0065 0,00006 ***
qemp86 -0,104113 0,0103877 -10,0227 <0,00001 ***
Média da variável dependente = 0,404404
Desvio padrão da variável dependente = 0,859077
Soma dos resíduos quadrados = 1927,27
Erro padrão dos resíduos = 0,841603
R2 não-ajustado = 0,0413233
R2 ajustado = 0,0402663
Estatística-F (3, 2721) = 39,0958 (p-valor < 0,00001)
![Page 25: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/25.jpg)
Passo 2
uqemptime
tottimeavgsenpcnvuhat
+++
++++=
86.86.
...2
54
3210
ββ
ββββ
Modelo 3: Estimativas OLS usando as 2725 observações 1-2725
Variável dependente: uhat2
Variável Coeficiente Erro Padrão estatística-t p-valor
const -0,00571081 0,0331524 -0,1723 0,86325
pcnv -0,00129713 0,040855 -0,0317 0,97467
avgsen -0,00704866 0,0124122 -0,5679 0,57016
25
avgsen -0,00704866 0,0124122 -0,5679 0,57016
tottime 0,0120953 0,00957684 1,2630 0,20671
ptime86 -0,0048386 0,00891659 -0,5427 0,58741
qemp86 0,00102209 0,0103972 0,0983 0,92170
Média da variável dependente = 0
Desvio padrão da variável dependente = 0,84114
Soma dos resíduos quadrados = 1924,39
Erro padrão dos resíduos = 0,841284
R2 não-ajustado = 0,00149385
R2 ajustado = -0,000342319
Estatística-F (5, 2719) = 0,813569 (p-valor = 0,54)
![Page 26: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/26.jpg)
Estatística LM
4,090,0015).(725.2LM
2
==
= unRLM
a
26
61,409,4
61,4%)10( críticovalor
~ 22
<=
=
LM
c
LMa
χ
![Page 27: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/27.jpg)
Regra de rejeiçãoComparar LM com o valor crítico apropriado, c,
de uma distribuição qui-quadrado.
Se LM > c, a hipótese nula é rejeitada.
27
61,409,4 <=LM
Não podemos rejeitar a hipótese nula ao nível
de 10%!!!
![Page 28: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/28.jpg)
P-valor
Podemos rejeitar a hipótese nula ao nível
de 15% pois o p-valor é menor (12,9%).
0,1294,09)( 22 =>χP
28
2
Pode consultar o p-valor no gretl: localizador de
p-valor, coloque o grau de liberdade e o valor
que corresponde a estatística t)
Qui-quadrado(2): área à direita de 4,09 = 0,12938
(à esquerda: 0,87062)
![Page 29: Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros](https://reader030.fdocument.pub/reader030/viewer/2022020205/5c4bd3b993f3c350ba7c2bc6/html5/thumbnails/29.jpg)
Eficiência assintótica
Existem outros estimadores consistentes além do de MQO.No entanto, sob as hipóteses Gauss-Markov, os de MQO terão as menores
29
Markov, os de MQO terão as menores variâncias assintóticas. Dizemos que MQO são assintoticamente eficientes.