Eine Störvariable ist eine Variable, die sowohl die unabhängige als auch die abhängige Variable beeinflusst und zu einer falschen Korrelation zwischen ihnen führt. Eine konfundierende Variable wird auch als Confounder, Confounding Factor oder Lurking Variable bezeichnet. Da Störvariablen in Experimenten häufig vorkommen, bedeutet Korrelation nicht gleich Kausalität. Mit anderen Worten, wenn Sie eine Änderung der unabhängigen Variable und eine Änderung der abhängigen Variable sehen, können Sie nicht sicher sein, dass die beiden Variablen miteinander zusammenhängen.
Hier sind Beispiele für Störvariablen, ein Blick auf den Unterschied zwischen einem Störfaktor und einem Mediator und Möglichkeiten, das Risiko von Störvariablen zu reduzieren, die zu falschen Schlussfolgerungen führen.
Positives und negatives Confounding
Manchmal weist Confounding auf eine falsche Ursache-Wirkungs-Beziehung hin, während es in anderen Fällen einen wahren Effekt maskiert.
- Positives Confounding: Positives Confounding überschätzt die Beziehung zwischen den unabhängigen und abhängigen Variablen. Es verzerrt die Ergebnisse weg von der Nullhypothese.
- Negatives Confounding: Negatives Confounding unterschätzt die Beziehung zwischen den unabhängigen und abhängigen Variablen. Es verzerrt die Ergebnisse in Richtung der Nullhypothese.
Beispiele für Confounding-Variablen
- In einer Studie, in der die unabhängige Variable der Eisverkauf und die abhängige Variable die Hai-Attacken sind, sieht ein Forscher, dass erhöhte Verkäufe mit Hai-Attacken Hand in Hand gehen. Die verwirrende Variable ist der Hitzeindex. Wenn es heißer ist, kaufen mehr Leute Eiscreme und mehr Leute gehen in (haiverseuchten) Gewässern schwimmen. Es gibt keinen kausalen Zusammenhang zwischen dem Kauf von Eiscreme und Haiangriffen.
- Echtes positives Confounding-Beispiel: Eine Harvard-Studie von 1981 brachte Kaffeetrinken mit Bauchspeicheldrüsenkrebs in Verbindung. Rauchen war in dieser Studie die Confounding-Variable. Viele der Kaffeetrinker in der Studie rauchten auch. Als die Daten um das Rauchen bereinigt wurden, verschwand der Zusammenhang zwischen Kaffeekonsum (die unabhängige Variable) und dem Auftreten von Bauchspeicheldrüsenkrebs (die abhängige Variable).
- Reales Beispiel für negatives Confounding: In einer Studie aus dem Jahr 2008 über die Toxizität (abhängige Variable) von Methylquecksilber in Fisch und Meeresfrüchten (unabhängige Variable) fanden die Forscher heraus, dass die vorteilhaften Nährstoffe in der Nahrung (Confounding-Variable) einigen der negativen Auswirkungen der Quecksilbertoxizität entgegenwirkten.
Korrelation impliziert keine Kausalität. Wenn Sie nicht überzeugt sind, sehen Sie sich die von Tyler Vigen zusammengestellten falschen Korrelationen an.
Wie Sie das Risiko von Störvariablen reduzieren
Der erste Schritt, um das Risiko von Störvariablen zu reduzieren, die Ihr Experiment beeinflussen, ist zu versuchen, alles zu identifizieren, was die Studie beeinflussen könnte. Es ist eine gute Idee, in der Literatur nachzuschauen oder zumindest andere Forscher nach Störfaktoren zu fragen. Andernfalls werden Sie sie wahrscheinlich bei der Begutachtung herausfinden!
Wenn Sie ein Experiment entwerfen, sollten Sie diese Techniken in Betracht ziehen, um den Effekt von Störvariablen zu reduzieren:
- Einführen von Kontrollvariablen. Wenn Sie zum Beispiel glauben, dass das Alter ein Störfaktor ist, testen Sie nur innerhalb einer bestimmten Altersgruppe. Wenn die Temperatur ein potenzieller Störfaktor ist, kontrollieren Sie sie.
- Seien Sie konsequent, was die Zeit angeht. Nehmen Sie Daten zur gleichen Tageszeit auf. Wiederholen Sie die Experimente zur gleichen Jahreszeit. Variieren Sie nicht die Dauer der Behandlungen innerhalb eines einzelnen Experiments.
- Wenn möglich, verwenden Sie doppelte Verblindung. In einem doppelt verblindeten Experiment wissen weder der Forscher noch die Versuchsperson, ob eine Behandlung durchgeführt wurde oder nicht.
- Randomisieren Sie. Wählen Sie Kontrollen und Versuchspersonen nach dem Zufallsprinzip aus, anstatt den Forscher die Gruppe auswählen zu lassen oder (bei Humanexperimenten) die Versuchspersonen die Teilnahme auswählen zu lassen.
- Verwenden Sie Fallkontrollen oder Matching. Wenn Sie Störvariablen vermuten, stimmen Sie Versuchsperson und Kontrolle so weit wie möglich überein. In Humanexperimenten könnten Sie Probanden gleichen Alters, Geschlechts, gleicher ethnischer Zugehörigkeit, gleicher Bildung, gleicher Ernährung usw. auswählen. Für Tier- und Pflanzenstudien würden Sie reine Linien verwenden. In chemischen Studien verwenden Sie Proben vom gleichen Lieferanten und der gleichen Charge.
Confounder vs Mediator oder Effektmodifikator
Ein Confounder beeinflusst sowohl die unabhängige als auch die abhängige Variable. Im Gegensatz dazu beeinflusst ein Mediator oder Effektmodifikator nicht die unabhängige Variable, sondern modifiziert den Effekt, den die unabhängige Variable auf die abhängige Variable hat. Bei einem Test zur Wirksamkeit eines Medikaments kann es beispielsweise sein, dass das Medikament bei Kindern wirksamer ist als bei Erwachsenen. In diesem Fall ist das Alter ein Effektmodifikator. Das Alter hat keinen Einfluss auf das Medikament selbst, ist also kein Confounder.
Confounder vs Bias
In gewisser Weise führt eine Confounder-Variable zu einem Bias, da sie das Ergebnis eines Experiments verzerrt. Allerdings bezieht sich Bias in der Regel auf eine Art von systematischem Fehler bei der Versuchsplanung, der Datenerfassung oder der Datenanalyse. Ein Experiment kann Verzerrungen enthalten, ohne von einer Störvariable beeinflusst zu werden.
Störvariable: Ein Faktor, der sowohl die unabhängige als auch die abhängige Variable beeinflusst, was zu einer falschen Assoziation zwischen ihnen führt.
Effektmodifikator: Eine Variable, die den Effekt der unabhängigen Variable auf die abhängige Variable positiv oder negativ modifiziert.
Bias: Ein systematischer Fehler, der den wahren Effekt der unabhängigen Variable auf die abhängige Variable verschleiert.
- Axelson, O. (1989). „Confounding from smoking in occupational epidemiology“. British Journal of Industrial Medicine. 46 (8): 505-07. doi:10.1136/oem.46.8.505
- Kish, L (1959). „Some statistical problems in research design“. Am Sociol. 26 (3): 328-338. doi:10.2307/2089381
- VanderWeele, T.J.; Shpitser, I. (2013). „On the definition of a confounder“. Annals of Statistics. 41 (1): 196-220. doi:10.1214/12-aos1058
- Yule, G. Udny (1926). „Why do we Sometimes get Nonsense-Correlations between Time-Series? A Study in Sampling and the Nature of Time-Series“. Journal of the Royal Statistical Society. 89 (1): 1-63. doi:10.2307/2341482