Estimação de Variáveis Instrumentais e Mínimos Quadrados ...
Transcript of Estimação de Variáveis Instrumentais e Mínimos Quadrados ...
1
Estimação de Variáveis
Instrumentais e Mínimos
Quadrados de Dois
Estágios
Wooldridge, Cápítulo 15
2
Variáveis Instrumentais
(IV)
3
Variáveis Instrumentais
yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei
Considere o seguinte modelo de regressão
linear múltipla
4
Variáveis Instrumentais
Suposições
a) Modelo é linear nos parâmetros e a matriz X é de
posto completo.
b)
c) X’X admite inversa
d)
e)
~~0X
~~
E E ee
~
plim QX'X~~
n
1
~n
~~IXe
2
Var
5
As suposições (a), (b), (c) e (d) são
necessárias para demonstrar a consistência
do vetor de estimadores ~
β̂
Variáveis Instrumentais
6
Variáveis Instrumentais
Hipótese Crucial
~~0X
~~
E E ee
Ou seja, todos os fatores contidos em e devem ser
não correlacionados com as variáveis explicativas e
deve ter sido usada a forma funcional correta.
7
Variáveis Instrumentais
Suposição: E(ei | x1, x2, ..., xk) = E(ei) = 0
Como pode falhar?
yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei
• Omissão de Variáveis
(Ignorar o problema? Usar proxy? Dados em Painel?)
• Erro nas Variáveis
• Endogeneidade
8
Uma variável explicativa, num modelo de regressão
linear, que é correlacionada com o termo de erro é
dita variável explicativa endógena.
Endogeneidade
Problema:
~~~0e'X
n
1plim
Variáveis Instrumentais
yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei
9
Dessa forma, se estimarmos o modelo de regressão
linear por mínimos quadrados teremos estimadores
viesados e inconsistentes para os parâmetros do
modelo.
Variáveis Instrumentais
yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei
10
Variáveis Instrumentais
Considere o seguinte modelo de regressão
Exemplo 1
Ih = 0 + 1 educh + 2 filhosh + 3 rendah + ei
Ih – indicador de saúde do h-ésimo domicílio
educh – educação do chefe da família do h-ésimo domicílio
filhosh – número de filhos no h-ésimo domicílio
rendah – renda do h-ésimo domicílio
número de filhos é uma decisão endógena, pode depender de
diversos fatores
11
Variáveis Instrumentais
Considere o seguinte modelo de regressão
Exemplo 2
salárioi = 0 + 1 educi + 2 x2i + ... + k xki + ei
01
~~eeduc'plim
n
Quais seriam os motivos desta violação?
Possíveis soluções?
12
Uso de variáveis instrumentais
Solução
Variáveis Instrumentais
yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei
13
Considere o modelo
Variáveis Instrumentais
yi = 0 + 1 x1i + ei (1)
com
Cov(x1, e) 0
14
Mas, suponha que tenha sido observada uma
variável z que satisfaça a duas suposições:
Variáveis Instrumentais
(a) z é não-correlacionada com e, isto é,
Cov(z, e) = 0
(b) z é correlacionada com x1, isto é,
Cov(z, x1) 0
z é exógena em (1)
Como testar tais suposições?
15
Do exposto, chamaremos z de variável
instrumental para x1.
Variáveis Instrumentais
16
Variáveis Instrumentais
Em termos matriciais:
~ZX
~~QX'Z
n
1plim (b.1)
~~~0eZ
'plim (a.1)
n
1
~Z
~X
- Matriz de Instrumentos
- Matriz de Explicação
17
Variáveis Instrumentais
Considere o seguinte modelo de regressão
Voltando ao Exemplo 2
salárioi = 0 + 1 educi + 2 x2i + ... + k xki + ei
Devemos procurar uma variável correlacionada com educ e
não-correlacionada com habilidade (que está no termo de erro
e é correlacionada com educ)
Possíveis instrumentos?
18
• O método de estimação com o uso de
variáveis instrumentais (IV) é mais geral do
que OLS;
Variáveis Instrumentais
• OLS é um caso particular de IV, uso as
variáveis explicativas como instrumentos delas
mesmas.
19
Variáveis Instrumentais
Considere o modelo de regressão linear geral
~~~~
eβXy
Pré multiplicando a equação anterior pela transposta
da matriz de instrumentos, temos que:
~~~~~~~e'ZβX'Zy'Z
20
Variáveis Instrumentais
Multiplicando a equação anterior por n-1, vem que:
~~~~~~~e'ZβX'Zy'Z
nnn
111
e tomando o limite de probabilidade em ambos os
lados da igualdade, temos que:
~~~~~~~
~~~~~~~
e'ZβX'Zy'Z
e'ZβX'Zy'Z
nnn
nnn
111
111
plimplimplim
plimplim
21
Variáveis Instrumentais
(cont.)
~IV
~
~~~~~~~~~
~~~~~
~~~~~~~
ββ
y'ZX'Zy'ZX'Zβ
y'ZX'Zβ
e'ZβX'Zy'Z
ˆplim
plimplim
plimplim
plimplim plim
11
1
11
11
111
nn
nn
nnn
22
Variáveis Instrumentais
Assim,
~~~~~
IV y'ZX'Zβ1
ˆ
Que é um estimador consistente!
23
Variáveis Instrumentais
Observações
(i) Admitindo a validade das suposições (a.1) e (b.1), o vetor
de estimadores gerado com o uso de variáveis
instrumentais é consistente.
(ii) Para estimar o vetor de parâmetros, precisamos garantir
que a matriz Z’X admite inversa. Logo, se Z for uma matriz
de dimensão n x L e X for uma matriz de dimensão n x (k +
1), precisaremos que L = k + 1. (neste caso, obtenho os
estimadores diretamente)
24
Variáveis Instrumentais
Observações (cont.)
iii. Faremos, ainda, uma suposição adicional de que a
variável instrumental z seja fortemente correlacionada
com a variável endógena x. (suposição ligada ao fato do
uso de instrumentos fracos)
iv. De (iii) conseguimos garantir que o método de estimação
proposto apresenta bom desempenho com amostras
finitas.
Leitura: Wooldridge (2003, p. 493-94)
25
Variáveis Instrumentais
'ˆˆEˆVar
~~IV
~~IV
~IV βββββ
~~~~~~
IV
~~~~~~IV
~~~~~~~~~~IV
~~~~~~~~~~~IV
e'ZX'Zββ
e'ZX'Zββ
e'ZX'ZβX'ZX'Zβ
eβX'ZX'Zy'ZX'Zβ
1
1
11
11
ˆ
ˆ
ˆ
ˆMas,
26
Variáveis Instrumentais
'ˆˆEˆVar
~~IV
~~IV
~IV βββββ
11
11
~~~~~~~~~IV
~~~~~~~~~IV
~~IV
~~IV
~IV
ZXZee'ZX'Zβ
ZXZee'ZX'Zβ
βββββ
''EˆVar
''EˆVar
'ˆˆEˆVarLogo,
27
Variáveis Instrumentais
'ˆˆEˆVar
~~IV
~~IV
~IV βββββ
112
~~~~~~~IV ZXZ'ZX'Zβ 'ˆVar
Se a suposição de homocedasticidade for válida, então,
e
112
~~~~~~~IV ZXZ'ZX'Zβ 'ˆˆVar
~IV
~~~IV
~~~~βXyβXye'e ˆ'ˆˆˆˆ
nn
112
com
28
Variáveis Instrumentais
'ˆˆEˆVar
~~IV
~~IV
~IV βββββ
Caso contrário,
112
~~~~~~~~IV ZXZΩ'ZX'Zβ 'ˆVar
29
Variáveis Instrumentais
É possível provar que
~
1XZ
~ZZ
~
1ZX
~~~IV QQQ0ββ
2 , ~ˆa
Nn
30
Variáveis Instrumentais
Exemplo
~~~~
eβXy
em que
~k
~3
~2
~1
~ ... xxxxi
~X
Considere o modelo de regressão linear geral
Desconfia-se que as variáveis x1 e x2 sejam
endógenas.
31
Perguntas:
(a) Poderíamos propor o mesmo instrumento para ambas as
variáveis? Discuta as implicações no método de estimação.
(b) Haveria algum problema no caso em que fossem propostos
exatamente um instrumento diferente para cada variável?
(c) Poderíamos propor mais de um instrumento para cada variável
endógena?
(d) De acordo com o enunciado de (c), como ficariam as dimensões
das matrizes Z e X?
(e) Admitindo a validade de (c), seria possível gerar diretamente o
vetor de estimadores?
Variáveis Instrumentais
Exemplo (cont.)
32
Solução para o que foi discutido em (c), (d) e (e):
2SLS
(mínimos quadrados em dois estágios)
Variáveis Instrumentais
Exemplo (cont.)
33
Inicialmente devemos construir a matriz de instrumentos
Z. As variáveis que são exógenas serão consideradas
instrumentos delas mesmas. Isso feito,
1o. Estágio: Regredir cada variável explicativa do modelo
original em função dos instrumentos (estimação das
formas reduzidas) e gerar uma matriz de valores
ajustados em cada um das regressões;
2o. Estágio: Estimar o modelo para a variável resposta
em função dos valores estimados para as variáveis
explicativas.
Mínimos Quadrados em Dois Estágios
34
2o. Estágio:
1o. Estágio:
Mínimos Quadrados em Dois Estágios
~~~πZX ˆˆ
~~~~
eβXy ˆ
~~~~υ πZX
Obter
~~~~~XZZZπ ''ˆ
1Onde
35
Mínimos Quadrados em Dois Estágios
~~
Z~~~~~~~~
XHXZZZZπZX
''ˆˆ 1
Temos que no primeiro estágio que:
~~~~~XZZZπ ''ˆ
1
Assim,
36
Logo,
Mínimos Quadrados em Dois Estágios
~~
Z~~~~~~~~
XHXZZZZπZX
''ˆˆ 1
Sabemos, do 2o. estágio, que:
~~
1
~~y'XX'Xβ
2SLS ˆˆˆˆ~
Mas,
~~
Z~
1
~~Z
~~~Z
~
1
~~Z
~Z
~~~
1
~~y'H'XXH'Xy'H'XXH'H'Xy'XX'Xβ
2SLS
ˆˆˆˆ
~
37
Logo,
Mínimos Quadrados em Dois Estágios
~~Z
~
1
~~Z
~~~~~~Z
~
1
~~Z
~e'H'XXH'XβeβX'H'XXH'Xβ
2SLS
ˆ
~
Do exposto,
~~Z
~
1
~~Z
~e'H'XXH'Xββ
2SLS
~~
ˆ
Mas,
~~Z
~
1
~~Z
~y'H'XXH'Xβ
2SLS
~
ˆ
38
Mínimos Quadrados em Dois Estágios
1
~~Z
~~~Z
~~~Z
~
1
~~Z
~XH'XXHeeH'XXH'Xβ
2SLS
'ˆ
~
EVar
Assim,
Pode ser expressa como,
'ˆˆˆ
~~~~~
βββββ2SLS2SLS2SLS
EVar
39
Mínimos Quadrados em Dois Estágios
1
22
~~Z
~XH'Xβ
SLS
~
ˆVar
Se a suposição de homocedasticidade for válida, então,
e
1
22
~~Z
~XH'Xβ ̂ˆVar
~
SLS
2SLS
~~~
2SLS
~~~~~βX yβX ye'e ˆ'ˆˆˆˆ
nn
112
com
40
Mínimos Quadrados em Dois Estágios
11
2
~~Z
~~~Z
~~Z
~~~Z
~XH'XXHΩH'XXH'Xβ
SLS
~
ˆVar
Caso contrário,
41
Mínimos Quadrados em Dois Estágios
É possível provar que
SLSSLSVarN
22
~
a
~
ˆ , ~ˆ βββ~
42
1) IV pode ser bem mais ineficiente que OLS;
2) A distribuição de probabilidades do estimador
usando IV, no caso de amostras finitas, pode ser
bem diferente da distribuição de probabilidades
assintótica.
Mínimos Quadrados em Dois Estágios
Problemas
Mesmo quando Corr(z,e) = 0, onde IV é consistente,
ainda podemos ter problemas:
43
Teste de Endogeneidade
Mínimos Quadrados em Dois Estágios
O estimador de 2SLS é menos eficiente que o de
OLS quando as variáveis explicativas são exógenas.
Assim sendo, se torna útil fazer um teste de
endogeneidade de uma variável explicativa que
mostre se a utilização de 2SLS é necessária.
44
Considere o modelo
Mínimos Quadrados em Dois Estágios
y1 = 0 + 1y2 + 2z1 + 3z2 + e1 (1)
em que
y2 – variável endógena
z1 e z2 – variáveis exógenas
Teste de Endogeneidade
45
Fatos
1. Se y2 for não correlacionada com e1, então,
devemos estimar os parâmetros do modelo por
OLS (mais eficiente).
2. OLS e 2SLS fornecem estimadores consistentes
se a condição de exogeneidade estiver satisfeita.
Mínimos Quadrados em Dois Estágios
Teste de Endogeneidade
46
Teste de Endogeneidade
Mínimos Quadrados em Dois Estágios
HAUSMAN (1978), sugeriu fazer uma comparação
direta das estimativas de OLS e 2SLS e determinar
se as diferenças são estatisticamente significantes.
Se as estimativas geradas por OLS e 2SLS
diferirem de forma significante, concluímos que y2
deve ser endógena (supondo z1 e z2 exógenas).
47
Teste de Endogeneidade
Mínimos Quadrados em Dois Estágios
1) Estime a forma reduzida de y2, regredindo y2
sobre todas as variáveis exógenas (inclusive
aquelas da equação estrutural e as IVs adicionais).
2) Obtenha os resíduos.
3) Estime a equação estrutural, por OLS, utilizando
os resíduos, obtidos em (2), como variável
explicativa. Se o parâmetro associado ao resíduo
for estatisticamente significante, concluiremos que
y2 é endógena.
48
Teste de Restrições Sobreidentificadoras
Mínimos Quadrados em Dois Estágios
Suponha que em nosso modelo apareça somente uma
variável explicativa endógena:
Se tivermos somente uma única IV, não teremos
restrições sobreidentificadoras. Neste caso, não haverá
nada que possa ser testado
Se tivermos somente duas IVs, teremos uma restrição
sobreidentificadora. Se tivermos três IVs, teremos duas
restrições sobreidentificadoras, e assim por diante.
49
Teste de Restrições Sobreidentificadoras
Mínimos Quadrados em Dois Estágios
1) Estime a equação estrutural por 2SLS
2) Obtenha os resíduos.
3) Regrida os resíduos em função de todas as
variáveis exógenas.
4) Obtenha o R2 (coeficiente de explicação).
5) Sob a hipótese nula de que todas as IVs são não
correlacionadas com o erro,
nR2 ~2q
q – número de variáveis endógenas.
50
Teste de Restrições Sobreidentificadoras
Mínimos Quadrados em Dois Estágios
Rejeitar a hipótese nula significa que
pelo menos uma das IVs não é exógena.