Skip to main content

Análise de Regressão

Em diversos problemas das áreas médica, biológica, industrial, química entre outras, é de grande interesse verificar se duas ou mais variáveis estão relacionadas de alguma forma. Para expressar esta relacão é muito importante estabelecer um modelo matemático. Este tipo de modelagem é chamado de regressão, e ajuda a entender como determinadas variáveis influenciam outra variável, ou seja, verifica como o comportamento de uma(s) variável(is) pode mudar o comportamento de outra.

Esta relação pode ser analisada como um processo. Neste processo, os valores de $ X_1, X_2,\ldots,X_n $ são chamados de Variáveis de Entrada ou Regressoras (inputs) e $ Y $ de Variável de Saída ou Resposta (output).

 

Processo

Figura 1.1: Representação dos Processos.

A Análise de Regressão possibilita encontrar uma relação razoável entre as variáveis de entrada e saída, por meio de relações empíricas. A utilização desta abordagem necessita de coleta de dados e do uso de métodos estatísticos de Análise de Regressão Linear. A coleta de dados permite conhecer a natureza da relação entre as variáveis e realizar estudos capazes de acomodar situações inesperadas, como por exemplo, variabilidade na matéria prima, temperatura ambiente, máquina e operadores.

Se estamos interessados na relação de apenas uma variável de entrada com a variável resposta temos o caso de Regressão Linear Simples. Mas se queremos relacionar a variável resposta com mais de uma variável regressora, a Regressão Linear Múltipla é utilizada.

Caso a variável resposta seja uma variável categórica, ou seja, a variável apresenta como possíveis realizações uma qualidade (ou atributo) e não mais uma mensuração, utilizamos o Modelo de Regressão Logística.

 

 

Objetivos

Modelos de Regressão são construídos com os objetivos:

i) Predição - Uma vez que esperamos que grande parte da variação da variável de saída seja explicada pelas variáveis de entrada, podemos utilizar o modelo para obter valores de Y correspondentes a valores de X que não estavam entre os dados. Esse procedimento é chamado de predição e, em geral, usamos valores de X que estão dentro do intervalo de variação estudado. A utilização de valores fora desse intervalo recebe o nome de extrapolação e deve ser usada com muito cuidado, pois, o modelo adotado pode não ser correto fora do intervalo estudado. Acredita-se que a predição seja a aplicação comum dos modelos de regressão; 

ii) Seleção de variáveis - Frequentemente, não se tem ideia de quais são as variáveis que afetam significativamente a variação de Y. Para responder a esse tipo de questão, estudos são realizados com um grande número de variáveis. A análise de regressão pode auxiliar no processo de seleção de variáveis eliminando aquelas cuja contribuição não seja importante; 

iii) Estimação de parâmetros - Dado um modelo e um conjunto de dados referente às variáveis resposta e preditoras, estimar parâmetros ou ajustar um modelo aos dados significa obter valores ou estimativas para os parâmetros, por algum processo, tendo por base o modelo e os dados observados;

iv) Inferência - O ajuste de um modelo de regressão em geral tem por objetivos básicos, além de estimar os parâmetros, realizar inferências sobre eles, tais como, testes de hipóteses e intervalos de confiança.