Colinearidade, em estatística, correlação entre variáveis preditoras (ou variáveis independentes), de modo a exprimirem uma relação linear num modelo de regressão. Quando as variáveis preditoras no mesmo modelo de regressão estão correlacionadas, não podem prever independentemente o valor da variável dependente. Por outras palavras, explicam alguma da mesma variância na variável dependente, o que por sua vez reduz a sua significância estatística.
Colinearidade torna-se uma preocupação na análise de regressão quando existe uma correlação elevada ou uma associação entre duas variáveis preditoras potenciais, quando existe um aumento dramático do valor p (ou seja, redução do nível de significância) de uma variável preditor quando outro preditor é incluído no modelo de regressão, ou quando é determinado um elevado factor de inflação da variância. O factor de inflação da variância fornece uma medida do grau de colinearidade, de tal forma que um factor de inflação da variância de 1 ou 2 mostra essencialmente nenhuma colinearidade e uma medida de 20 ou superior mostra colinearidade extrema.
Multicolinearidade descreve uma situação em que mais de duas variáveis preditoras estão associadas de modo a que, quando todas estão incluídas no modelo, se observe uma diminuição da significância estatística. À semelhança do diagnóstico da colinearidade, a multicolinearidade pode ser avaliada utilizando factores de inflação de variância com o mesmo guia que valores superiores a 10 sugerem um elevado grau de multicolinearidade. Ao contrário do diagnóstico para a colinearidade, contudo, pode não ser possível prever a multicolinearidade antes de observar os seus efeitos no modelo de regressão múltipla, porque quaisquer duas das variáveis preditoras podem ter apenas um baixo grau de correlação ou associação.