O que é uma variável confusa? Definição e exemplos

Uma variável confusa leva a uma falsa associação entre a variável independente e a dependente.
Uma variável confusa leva a uma falsa associação entre a variável independente e a dependente.

Uma variável confundente é uma variável que influencia tanto a variável independente como a dependente e leva a uma falsa correlação entre elas. Uma variável confundente é também chamada variável confundidora, factor de confusão, ou variável de espreita. Como as variáveis de confusão existem frequentemente em experiências, a correlação não significa causa de causalidade. Por outras palavras, quando se vê uma mudança na variável independente e uma mudança na variável dependente, não se pode ter a certeza de que as duas variáveis estão relacionadas.

Aqui estão exemplos de variáveis de confusão, um olhar sobre a diferença entre um confundidor e um mediador, e formas de reduzir o risco de as variáveis de confusão conduzirem a conclusões incorrectas.

Positivo e Confuso Negativo

Por vezes, o confundir aponta para uma falsa relação de causa e efeito, enquanto outras vezes mascara um efeito verdadeiro.

  • Confounding Positivo: O confundimento positivo sobrestima a relação entre as variáveis independentes e dependentes. O seu enviesamento resulta de um afastamento da hipótese nula.
  • Confounding Negativo: Confounding negativo subestima a relação entre as variáveis independentes e dependentes. Desvia os resultados para a hipótese nula.

Variável Confundante Exemplos

  • Num estudo em que a variável independente é a venda de gelados e a variável dependente é o ataque de tubarões, um investigador vê que o aumento das vendas anda a par com os ataques de tubarões. A variável que confunde é o índice de calor. Quando está mais quente, mais pessoas compram gelados e mais pessoas vão nadar em águas (infestadas de tubarões). Não há relação causal entre as pessoas que compram gelados e os que são atacados por tubarões.
  • Real Positive Confounding Example: Um estudo de Harvard de 1981 associou o consumo de café ao cancro pancreático. O tabagismo foi a variável de confusão neste estudo. Muitos dos consumidores de café do estudo também fumavam. Quando os dados foram ajustados para fumar, a ligação entre o consumo de café (a variável independente) e a incidência de cancro do pâncreas (a variável dependente) desapareceu.li>Real Negative Confounding Example (Exemplo Confuso Negativo Real): Num estudo de 2008 sobre a toxicidade (variável dependente) do metilmercúrio em peixes e mariscos (variável independente), os investigadores descobriram que os nutrientes benéficos nos alimentos (variável confusa) contrariaram alguns dos efeitos negativos da toxicidade do mercúrio.

Correlação não implica uma causa. Se não estiver convencido, verifique as correlações espúrias compiladas por Tyler Vigen.

Como Reduzir o Risco de Confusão

O primeiro passo para reduzir o risco de variáveis de confusão que afectam a sua experiência é tentar identificar qualquer coisa que possa afectar o estudo. É uma boa ideia verificar a literatura ou pelo menos perguntar a outros investigadores sobre os confundidores. Caso contrário, é provável que os descubra durante a revisão por pares!

Ao conceber uma experiência, considere estas técnicas para reduzir o efeito de variáveis confusas:

  • Introduzir variáveis de controlo. Por exemplo, se achar que a idade é um factor de confusão, teste apenas dentro de um determinado grupo etário. Se a temperatura é um potencial confundidor, controle-a.
  • Seja consistente com o tempo. Tomar os dados à mesma hora do dia. Repetir experiências na mesma altura do ano. Não variar a duração dos tratamentos dentro de uma única experiência.
  • Sempre que possível, utilizar a dupla ocultação. Numa experiência de dupla ocultação, nem o investigador nem o sujeito sabem se foi ou não aplicado um tratamento.
  • Randomizar. Seleccionar controlos e testar os sujeitos de forma aleatória, em vez de fazer o investigador escolher o grupo ou (em experiências humanas) deixar os sujeitos seleccionar a participação.
  • Utilizar controlos de caso ou correspondência. Se suspeitar de variáveis de confusão, faça corresponder o sujeito do teste e controle o máximo possível. Em experiências em humanos, poderá seleccionar sujeitos da mesma idade, sexo, etnia, educação, dieta, etc. Para estudos com animais e plantas, utilizaria linhas puras. Em estudos químicos, utilizar amostras do mesmo fornecedor e lote.

Confounder vs Mediator ou Effect Modifier

A confusão afecta tanto as variáveis independentes como as dependentes. Em contraste, um mediador ou modificador de efeitos não afecta a variável independente, mas modifica o efeito que a variável independente tem sobre a variável dependente. Por exemplo, num teste de eficácia do medicamento, o medicamento pode ser mais eficaz em crianças do que em adultos. Neste caso, a idade é um modificador de efeito. A idade não afecta a droga em si, pelo que não é um confundidor.

Confounder vs Bias

De certa forma, uma variável confundidora resulta em enviesamento na medida em que distorce o resultado de uma experiência. No entanto, o enviesamento refere-se geralmente a um tipo de erro sistemático da concepção experimental, recolha de dados, ou análise de dados. Uma experiência pode conter um enviesamento sem ser afectada por uma variável confusa.

Variável Confundante: Um factor que afecta tanto as variáveis independentes como as dependentes, levando a uma falsa associação entre elas.
Effect Modifier: Uma variável que modifica positiva ou negativamente o efeito da variável independente sobre a variável dependente.
Bias: Um erro sistemático que mascara o verdadeiro efeito da variável independente sobre a variável dependente.

  • Axelson, O. (1989). “Confounding from smoking in occupational epidemiology”. British Journal of Industrial Medicine. 46 (8): 505-07. doi:10.1136/oem.46.8.505
  • Kish, L (1959). “Alguns problemas estatísticos na concepção da investigação”. Am Sociol. 26 (3): 328-338. doi:10.2307/2089381
  • VanderWeele, T.J.; Shpitser, I. (2013). “Sobre a definição de um confundidor”. Anais de Estatística. 41 (1): 196-220. doi:10.1214/12-aos1058
  • li>Yule, G. Udny (1926). “Porque é que, por vezes, obtemos Correlações sem sentido entre Séries Temporais? Um Estudo sobre a Amostragem e a Natureza da Série Time-Series”. Diário da Royal Statistical Society. 89 (1): 1-63. doi:10.2307/2341482

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *