Trabalho Etapa 2
# Leitura dos dados
```
library(readxl)
dados=read_excel('base.xlsx')
View(dados)
```
# Definição das variáveis
```
Y=dados$Remuneracao
X1=dados$Emprego
#se sexo=Masculino=1, Base Feminino=0
sexo=factor(dados$Genero)
contrasts(sexo)
D1=as.numeric(sexo=='Masculino')
#Se tamanho=Pequeno, D2=1, caso contrário=0
#tamanho=Média, D3=1, caso contrário=0
#tamanho=Grande, D4=1, caso contrário=0
tamanho=factor(dados$Tamanho)
tamanho=relevel(tamanho,'Micro')
contrasts(tamanho)
D2=as.numeric(tamanho=='Pequeno')
D3=as.numeric(tamanho=='Média')
D4=as.numeric(tamanho=='Grande')
```
# a) Ajuste do modelo de regressão
```
modelo=lm(log(Y)~X1+sexo+tamanho,data=dados)
summary(modelo)
```
# b) Obtenha os resíduos do modelo estimado e faça o histograma dos resíduos. Faça os testes de Jarque-Bera e Shapiro Wilk para analisar a hipótese de normalidade dos erros. Os erros seguem uma distribuição Normal?
```
# Resíduos
res=modelo$residuals
summary(res)
# Histograma dos resíduos
hist(res,freq=F)
par(new=TRUE)
library(lmtest)
library(normtest)
## Teste de Jarque-Bera
jb.norm.test(modelo$residuals)
# O resultado nos diz que o p-valor é < 2.2e-16. Nesse caso, rejeitamos a hipótese nula de que os erros são normalmente distribuídos.
## Teste de Shapiro-Wilk
shapiro.test(modelo$residuals)
# O teste apresenta W = 0.92266 e p-valor < 2.2e-16. Rejeitamos a hipótese de que os erros seguem uma distribuição normal.
```
# c) Para o modelo (1), faça teste a hipótese de homoscedasticidade dos erros (Breush-Pagan). Caso rejeite a hipótese de variância constante, faça a correção aplicando o método dos mínimos quadrados generalizados;
```
# Teste de Homocedasticidade de Breush-Pagan
bptest(modelo)
# Uma vez que o p-valor não é inferior a 0.05, não rejeitamos a hipótese nula. Assumimos que a homocedasticidade está presente.
```
# d) Apresente os estimadores robustos de heterocedasticidade no modelo ajustado no item a);
```
library(car)
coeftest(modelo,vcov=hccm(modelo,type='hc0'))
```
# e) Teste a hipótese de autocorrelação serial (Teste de Durbin-Watson e Teste de Breush-Godfrey) no modelo ajustado no item a). Caso rejeite a hipótese de ausência de correlação, faça a correção aplicando o método de Cochrane-Orkutt.
```
#Teste de Durbin-Watson
dwtest(modelo)
# # Como p-valor é 3.745e-06 < 0.05, rejeitamos a hipótese nula de que há ausência de correlação serial.
# Teste de Breush-Godfrey
bgtest(modelo)
# Como o p-valor é 1.822e-05 < 0.05, rejeitamos a hipótese nula de que há ausência de correlação serial.
# Correção por Cochrane-Orkutt
#install.packages('orcutt')
library(orcutt)
modelo.co=cochrane.orcutt(modelo)
summary(modelo.co)
modelo$rho
```
# f) Para o modelo ajustado no item a) apresente os resultados de Mínimos Quadrados Ordinários Consistentes à Heterocedasticidade e Autocorrelação (HAC).
library(sandwich)
coeftest(modelo,vcovHAC)
```
# g) Há diferenças entre os valores estimados dos erros padrões associados dos estimadores nos modelos estimados nos itens a), d) e f)? Por quê?
library(stargazer)
stargazer(modelo,coeftest(modelo,vcov=hccm(modelo,type='hc0')),type='text')
=============================================================================
Dependent variable:
---------------------------------------------------------
log(Y)
OLS coefficient
test
MQO MQO-Robusto Variância Inf Robusta
(1) (2) (3)
-----------------------------------------------------------------------------
X1 1.265*** 1.265*** 1.265***
(0.087) (0.112) (0.132)
sexoMasculino 0.424*** 0.424*** 0.424***
(0.038) (0.038) (0.048)
tamanhoGrande 0.330*** 0.330*** 0.330***
(0.056) (0.057) (0.080)
tamanhoMédia 0.099* 0.099 0.099
(0.056) (0.060) (0.064)
tamanhoPequena 0.139*** 0.139*** 0.139**
(0.048) (0.050) (0.061)
Constant 7.598*** 7.598*** 7.598***
(0.060) (0.068) (0.082)
-----------------------------------------------------------------------------
Observations 717
R2 0.373
Adjusted R2 0.368
Residual Std. Error 0.503 (df = 711)
F Statistic 84.509*** (df = 5; 711)
=============================================================================
Note: *p<0.1; **p<0.05; ***p<0.01
#Nota-se que os valores das estátiticas não foram alterados, entretato, houve mudanças os valores do erro padrão das variáveis, como excessão "tamanhoGrande". Essa mudança ocorre pois há uma correção do modelo, inicialmente há a utilização dos mínimos quadrados "originais" (primeira coluna), já na segunda coluna, foi utilizado os mínimos quadrados ponderados, que tem como função corrigir os erros padrões do modelo inicial. As mudanças no erro padrão acontecem devido há uma correção da variância e da covariância, ponderando a matriz pela variabilidade do erro.
#h) Para o modelo estimado no item f): i) Interprete os parâmetros estimados; ii) Avalie a significância estatística das variáveis explicativas. iii) Conjuntamente, as variáveis independentes são significativas; iv) Interprete o coeficiente de determinação.
library(stargazer)
stargazer(modelo,coeftest(modelo,vcov=hccm),coeftest(modelo,vcovHAC),column.labels=c('MQO','MQO-Robusto Variância', 'Inf Robusta'),type='text')