Una variabile di confondimento è una variabile che influenza sia la variabile indipendente che la variabile dipendente e porta a una falsa correlazione tra loro. Una variabile confondente è anche chiamata confondente, fattore confondente, o variabile in agguato. Poiché le variabili confondenti esistono spesso negli esperimenti, la correlazione non significa causalità. In altre parole, quando si vede un cambiamento nella variabile indipendente e un cambiamento nella variabile dipendente, non si può essere certi che le due variabili siano correlate.
Qui ci sono esempi di variabili confondenti, uno sguardo alla differenza tra un confondente e un mediatore, e modi per ridurre il rischio di variabili confondenti che portano a conclusioni errate.
Confondimento positivo e negativo
A volte il confondimento indica una falsa relazione causa-effetto, mentre altre volte maschera un vero effetto.
- Confondimento positivo: Il confondimento positivo sovrastima la relazione tra le variabili indipendenti e dipendenti. Allontana i risultati dall’ipotesi nulla.
- Confondimento negativo: Il confondimento negativo sottostima la relazione tra le variabili indipendenti e dipendenti. Esso distorce i risultati verso l’ipotesi nulla.
Esempi di variabili di confondimento
- In uno studio in cui la variabile indipendente è la vendita di gelati e la variabile dipendente sono gli attacchi di squali, un ricercatore vede che l’aumento delle vendite va di pari passo con gli attacchi di squali. La variabile confondente è l’indice di calore. Quando fa più caldo, più persone comprano gelati e più persone vanno a nuotare in acque (infestate da squali). Non c’è una relazione causale tra le persone che comprano il gelato e gli attacchi di squali.
- Esempio reale di confusione positiva: Uno studio di Harvard del 1981 ha collegato il consumo di caffè al cancro al pancreas. Il fumo era la variabile di confondimento in questo studio. Molti dei bevitori di caffè nello studio fumavano anche. Quando i dati sono stati aggiustati per il fumo, il legame tra il consumo di caffè (la variabile indipendente) e l’incidenza del cancro al pancreas (la variabile dipendente) è svanito.
- Esempio reale di confusione negativa: In uno studio del 2008 sulla tossicità (variabile dipendente) del metilmercurio nel pesce e nei frutti di mare (variabile indipendente), i ricercatori hanno scoperto che i nutrienti benefici nel cibo (variabile di confondimento) hanno contrastato alcuni degli effetti negativi della tossicità del mercurio.
La correlazione non implica causalità. Se non siete convinti, date un’occhiata alle correlazioni spurie compilate da Tyler Vigen.
Come ridurre il rischio di confondimento
Il primo passo per ridurre il rischio di variabili di confondimento che influenzano il vostro esperimento è cercare di identificare qualsiasi cosa che potrebbe influenzare lo studio. È una buona idea controllare la letteratura o almeno chiedere ad altri ricercatori quali sono i confondenti. Altrimenti, è probabile che li scopriate durante la peer review!
Quando progettate un esperimento, considerate queste tecniche per ridurre l’effetto delle variabili confondenti:
- Introdurre variabili di controllo. Per esempio, se pensate che l’età sia un confondente, fate il test solo all’interno di un certo gruppo di età. Se la temperatura è un potenziale confondente, controllala.
- Siate coerenti riguardo al tempo. Prendi i dati alla stessa ora del giorno. Ripetete gli esperimenti nello stesso periodo dell’anno. Non variare la durata dei trattamenti all’interno di un singolo esperimento.
- Quando possibile, usa il doppio cieco. In un esperimento in doppio cieco, né il ricercatore né il soggetto sanno se un trattamento è stato applicato o meno.
- Randomizzare. Selezionare i controlli e i soggetti del test in modo casuale, piuttosto che far scegliere al ricercatore il gruppo o (negli esperimenti umani) lasciare che i soggetti scelgano la partecipazione.
- Utilizzare i controlli dei casi o la corrispondenza. Se sospettate che ci siano delle variabili di confondimento, abbinate il più possibile il soggetto del test e il controllo. Negli esperimenti umani, potreste selezionare soggetti della stessa età, sesso, etnia, educazione, dieta, ecc. Per gli studi su animali e piante, useresti linee pure. Negli studi chimici, usate campioni dello stesso fornitore e dello stesso lotto.
Confondatore vs Mediatore o Modificatore di effetti
Un confonditore influenza sia le variabili indipendenti che quelle dipendenti. Al contrario, un mediatore o modificatore di effetti non influenza la variabile indipendente, ma modifica l’effetto che la variabile indipendente ha sulla variabile dipendente. Per esempio, in un test sull’efficacia di un farmaco, il farmaco può essere più efficace nei bambini che negli adulti. In questo caso, l’età è un modificatore di effetto. L’età non influenza il farmaco in sé, quindi non è un confondente.
Confondente vs Bias
In un certo senso, una variabile confondente provoca bias in quanto distorce il risultato di un esperimento. Tuttavia, il bias di solito si riferisce a un tipo di errore sistematico del disegno sperimentale, della raccolta dei dati o dell’analisi dei dati. Un esperimento può contenere bias senza essere influenzato da una variabile di confondimento.
Variabile di confondimento: Un fattore che influenza sia la variabile indipendente che quella dipendente, portando ad una falsa associazione tra di esse.
Modificatore d’effetto: Una variabile che modifica positivamente o negativamente l’effetto della variabile indipendente sulla variabile dipendente.
Bias: Un errore sistematico che maschera il vero effetto della variabile indipendente sulla variabile dipendente.
- Axelson, O. (1989). “Confondere il fumo nell’epidemiologia occupazionale”. British Journal of Industrial Medicine. 46 (8): 505-07. doi:10.1136/oem.46.8.505
- Kish, L (1959). “Alcuni problemi statistici nel disegno della ricerca”. Am Sociol. 26 (3): 328-338. doi:10.2307/2089381
- VanderWeele, T.J.; Shpitser, I. (2013). “Sulla definizione di un confonditore”. Annali di statistica. 41 (1): 196-220. doi:10.1214/12-aos1058
- Yule, G. Udny (1926). “Perché a volte otteniamo correlazioni nonsense tra le serie temporali? Uno studio sul campionamento e la natura delle serie temporali”. Giornale della Royal Statistical Society. 89 (1): 1-63. doi:10.2307/2341482