Een verwarrende variabele is een variabele die zowel de onafhankelijke variabele als de afhankelijke variabele beïnvloedt en leidt tot een valse correlatie tussen beide. Een verwarrende variabele wordt ook een confounder, confounding factor of lurking variabele genoemd. Omdat er in experimenten vaak verwarrende variabelen voorkomen, betekent correlatie niet dat er een oorzakelijk verband is. Met andere woorden, wanneer je een verandering in de onafhankelijke variabele en een verandering in de afhankelijke variabele ziet, kun je er niet zeker van zijn dat de twee variabelen aan elkaar gerelateerd zijn.
Hier volgen voorbeelden van verwarrende variabelen, een blik op het verschil tussen een verwarrende en een bemiddelende variabele, en manieren om het risico te verkleinen dat verwarrende variabelen tot onjuiste conclusies leiden.
Positieve en negatieve confounding
Soms wijst confounding op een vals oorzakelijk verband, terwijl het andere keren een echt effect maskeert.
- Positieve confounding: Positieve confounding overschat de relatie tussen de onafhankelijke en afhankelijke variabelen. De resultaten wijken hierdoor af van de nulhypothese.
- Negatieve confounding: Negatieve confounding onderschat de relatie tussen de onafhankelijke en afhankelijke variabelen.
Voorbeelden van verwarrende variabelen
- In een studie waarin de onafhankelijke variabele de verkoop van ijsjes is en de afhankelijke variabele de aanvallen van haaien, ziet een onderzoeker dat een toename van de verkoop hand in hand gaat met aanvallen van haaien. De verwarrende variabele is de hitte-index. Als het warmer is, kopen meer mensen ijs en gaan meer mensen zwemmen in (door haaien geteisterde) wateren. Er is geen causaal verband tussen mensen die ijs kopen en door haaien worden aangevallen.
- Echt positief verstorend voorbeeld: Een Harvard-studie uit 1981 legde een verband tussen koffiedrinken en alvleesklierkanker. Roken was de beïnvloedende variabele in deze studie. Veel van de koffiedrinkers in het onderzoek rookten ook. Toen de gegevens werden gecorrigeerd voor roken, verdween het verband tussen koffieconsumptie (de onafhankelijke variabele) en de incidentie van alvleesklierkanker (de afhankelijke variabele).
- Echt negatief verstorend voorbeeld: In een onderzoek uit 2008 naar de toxiciteit (afhankelijke variabele) van methylkwik in vis en zeevruchten (onafhankelijke variabele), ontdekten onderzoekers dat de heilzame voedingsstoffen in het voedsel (confounding variabele) een deel van de negatieve effecten van kwikgiftigheid tegenwerkten.
Correlatie impliceert geen oorzakelijk verband. Als je niet overtuigd bent, bekijk dan de onechte correlaties die Tyler Vigen heeft verzameld.
Hoe het risico op verstoring te verkleinen
De eerste stap om het risico op verstorende variabelen die je experiment beïnvloeden te verkleinen, is om te proberen alles te identificeren wat het onderzoek zou kunnen beïnvloeden. Het is een goed idee om de literatuur te raadplegen of op zijn minst andere onderzoekers te vragen naar verwarrende variabelen. Anders kom je er waarschijnlijk achter tijdens de peer review!
Wanneer je een experiment ontwerpt, overweeg dan deze technieken om het effect van verstorende variabelen te verminderen:
- Stel controlevariabelen in. Als je bijvoorbeeld denkt dat leeftijd een verwarrende factor is, test dan alleen binnen een bepaalde leeftijdsgroep. Als temperatuur een potentiële verstoorder is, controleer die dan.
- Breng consistentie in tijd. Neem gegevens op hetzelfde tijdstip van de dag. Herhaal experimenten in dezelfde tijd van het jaar.
- Verschil de duur van de behandelingen niet binnen één experiment.
- Wanneer mogelijk, gebruik dan dubbele blindering. Bij een dubbelblind experiment weet noch de onderzoeker noch de proefpersoon of een behandeling al dan niet is toegepast.
- Randomiseren. Selecteer controles en proefpersonen willekeurig, in plaats van de onderzoeker de groep te laten kiezen of (bij menselijke experimenten) de proefpersonen deelname te laten kiezen.
- Gebruik case-controles of matching. Als u verwarrende variabelen vermoedt, moet u de proefpersoon en de controle zo veel mogelijk bij elkaar brengen. Bij menselijke experimenten kun je proefpersonen selecteren van dezelfde leeftijd, geslacht, etniciteit, opleiding, dieet, enz. Voor dier- en plantstudies zou u zuivere lijnen gebruiken. In chemische studies, gebruik je monsters van dezelfde leverancier en batch.
Confounder vs Mediator of Effect Modifier
Een confounder beïnvloedt zowel de onafhankelijke als de afhankelijke variabelen. Een mediator of effectmodificator heeft daarentegen geen invloed op de onafhankelijke variabele, maar wijzigt wel het effect dat de onafhankelijke variabele heeft op de afhankelijke variabele. Bijvoorbeeld, in een test van de doeltreffendheid van geneesmiddelen, kan het geneesmiddel doeltreffender zijn bij kinderen dan bij volwassenen. In dit geval is leeftijd een effectveranderaar. Leeftijd heeft geen invloed op het medicijn zelf, dus is het geen confounder.
Confounder vs Bias
In zekere zin leidt een confounding variabele tot bias in die zin dat het de uitkomst van een experiment verstoort. Maar bias verwijst meestal naar een soort systematische fout in het experimentele ontwerp, de gegevensverzameling of de gegevensanalyse. Een experiment kan bias bevatten zonder te worden beïnvloed door een confounding variable.
Confounding Variable: Een factor die zowel de onafhankelijke als de afhankelijke variabelen beïnvloedt, wat leidt tot een valse associatie tussen beide.
Effect Modifier: Een variabele die het effect van de onafhankelijke variabele op de afhankelijke variabele positief of negatief modificeert.
Bias: Een systematische fout die het ware effect van de onafhankelijke variabele op de afhankelijke variabele maskeert.
- Axelson, O. (1989). “Confounding from smoking in occupational epidemiology”. British Journal of Industrial Medicine. 46 (8): 505-07. doi:10.1136/oem.46.8.505
- Kish, L (1959). “Some statistical problems in research design”. Am Sociol. 26 (3): 328-338. doi:10.2307/2089381
- VanderWeele, T.J.; Shpitser, I. (2013). “Over de definitie van een confounder”. Annalen van de Statistiek. 41 (1): 196-220. doi:10.1214/12-aos1058
- Yule, G. Udny (1926). “Waarom krijgen wij soms Onzin-Correlaties tussen Tijdreeksen? A Study in Sampling and the Nature of Time-Series”. Journal of the Royal Statistical Society. 89 (1): 1-63. doi:10.2307/2341482