Skip to main content

3. Análise dos Resíduos

Tanto na Regressão Linear Simples quanto na Regressão Múltipla, as suposições do modelo ajustado precisam ser validadas para que os resultados sejam confiáveis. Chamamos de Análise dos Resíduos um conjunto de técnicas utilizadas para investigar a adequabilidade de um modelo de regressão com base nos resíduos. Como visto anteriormente, o resíduo $ (e_i) $ é dado pela diferença entre a variável resposta observada $ (Y_i) $ e a variável resposta estimada $ (\widehat{Y}_i) $, isto é

$$ e_i=Y_i-\widehat{Y}_i=Y_i-\widehat{\beta}_0-\widehat{\beta}_1x_{1i}-\dots-\widehat{\beta}_p x_{pi}\quad i=1,\dots,n.$$

A ideia básica da análise dos resíduos é que, se o modelo for apropriado, os resíduos devem refletir as propriedades impostas pelo termo de erro do modelo. Tais suposições são

$$Y = X \beta + \varepsilon,$$

em que $ \varepsilon = (\varepsilon_1, \varepsilon_2, \cdots,\varepsilon_n)', $ com

i. $ \varepsilon_i $ e $ \varepsilon_j $ são independentes $ (i\neq j) $;

ii. $ Var(\varepsilon_i) = \sigma^2 $ (constante);

iii. $ \varepsilon_i \sim N(0,\sigma^2) $ (normalidade);

iv. Modelo é linear;

v. Não existir outliers (pontos atípicos) influentes.

 

Na Regressão Múltipla, além das suposições listadas acima, precisamos diagnosticar colinearidade e multicolinearidade entre as variáveis de entrada para que a relação existente entre elas não interfira nos resultados, causando inferências errôneas ou pouco confiáveis.

As técnicas utilizadas para verificar as suposições descritas acima podem ser informais (como gráficos) ou formais (como testes). As técnicas gráficas, por serem visuais, podem ser subjetivas e por isso técnicas formais são mais indicadas para a tomada de decisão. O ideal é combinar as técnicas disponíveis, tanto formais quanto informais, para o diagnóstico de problemas nas suposições do modelo.

Algumas técnicas gráficas para análise dos resíduos são:

  • Gráfico dos resíduos versus valores ajustados: verifica a homoscedasticidade do modelo, isto é, σ2 constante.
  • Gráfico dos resíduos versus a ordem de coleta dos dados: avaliar a hipótese de independência dos dados.
  • Papel de probabilidade normal: verificar a  normalidade dos dados. Ver detalhes em Papel de Probabilidade no conteúdo de Inferência.
  • Gráfico dos Resíduos Studentizados versus valores ajustados: verifica se existem outliers em Y.
  • Gráfico dos Resíduos Padronizados versus valores ajustados: verifica se existem outliers em Y.
  • Gráfico do Leverage (Diagonal da Matriz H): verifica se existem outliers em X.

Para a análise formal dos resíduos, podemos realizar os seguintes testes:

  • Testes  de Normalidade em que detalhes estão contidos no conteúdo de Inferência.
  • Teste de Durbin-Watson para testar independência dos resíduos.
  • Teste de Breusch-Pagan e Goldfeld-Quandt para testar se os resíduos são homoscedásticos.
  • Teste de falta de ajuste para verificar se o modelo ajustado é realmente linear.

Para cada suposição do modelo, vamos mostrar detalhadamente as técnicas para diagnóstico.