Colinearidade, em estatística, correlação entre variáveis preditoras (ou variáveis independentes), de modo a exprimirem uma relação linear num modelo de regressão. Quando as variáveis preditoras no mesmo modelo de regressão estão correlacionadas, não podem prever independentemente o valor da variável dependente. Por outras palavras, explicam alguma da mesma variância na variável dependente, o que por sua vez reduz a sua significância estatística.

Colinearidade torna-se uma preocupação na análise de regressão quando existe uma correlação elevada ou uma associação entre duas variáveis preditoras potenciais, quando existe um aumento dramático do valor p (ou seja, redução do nível de significância) de uma variável preditor quando outro preditor é incluído no modelo de regressão, ou quando é determinado um elevado factor de inflação da variância. O factor de inflação da variância fornece uma medida do grau de colinearidade, de tal forma que um factor de inflação da variância de 1 ou 2 mostra essencialmente nenhuma colinearidade e uma medida de 20 ou superior mostra colinearidade extrema.

Multicolinearidade descreve uma situação em que mais de duas variáveis preditoras estão associadas de modo a que, quando todas estão incluídas no modelo, se observe uma diminuição da significância estatística. À semelhança do diagnóstico da colinearidade, a multicolinearidade pode ser avaliada utilizando factores de inflação de variância com o mesmo guia que valores superiores a 10 sugerem um elevado grau de multicolinearidade. Ao contrário do diagnóstico para a colinearidade, contudo, pode não ser possível prever a multicolinearidade antes de observar os seus efeitos no modelo de regressão múltipla, porque quaisquer duas das variáveis preditoras podem ter apenas um baixo grau de correlação ou associação.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *