Kontingenztabelle

Der Grad des Zusammenhangs zwischen den beiden Variablen kann durch eine Reihe von Koeffizienten beurteilt werden. Die folgenden Unterabschnitte beschreiben einige von ihnen. Eine umfassendere Diskussion ihrer Verwendung finden Sie in den Hauptartikeln, die unter den Überschriften der einzelnen Unterabschnitte verlinkt sind.

Odds ratioBearbeiten

Hauptartikel: Odds ratio

Das einfachste Assoziationsmaß für eine 2 × 2 Kontingenztabelle ist das Odds ratio. Bei zwei Ereignissen, A und B, ist das Odds Ratio definiert als das Verhältnis der Chancen von A bei Vorhandensein von B und der Chancen von A bei Abwesenheit von B, oder äquivalent (wegen der Symmetrie), das Verhältnis der Chancen von B bei Vorhandensein von A und der Chancen von B bei Abwesenheit von A. Zwei Ereignisse sind unabhängig, wenn und nur wenn das Odds Ratio 1 ist; wenn das Odds Ratio größer als 1 ist, sind die Ereignisse positiv assoziiert; wenn das Odds Ratio kleiner als 1 ist, sind die Ereignisse negativ assoziiert.

Das Odds Ratio hat einen einfachen Ausdruck in Form von Wahrscheinlichkeiten; gegeben die gemeinsame Wahrscheinlichkeitsverteilung:

B = 1 B = 0 A = 1 p 11 p 10 A = 0 p 01 p 00 {\displaystyle {\begin{array}{c|cc}&B=1&B=0iv A=1&p_{11}&p_{10}\\A=0&p_{01}&p_{00}\end{array}}}

${\begin{array}{c|cc}B=1B=0\\\\hline A=1p_{11}p_{10}\A=0p_{01}p_{00}\end{array}$

Das Odds Ratio ist:

O R = p 11 p 00 p 10 p 01 . {\displaystyle OR={\frac {p_{11}p_{00}}{p_{10}p_{01}}}.}

$OR={\frac {p_{11}p_{00}}{p_{10}p_{01}}}.$

Phi-KoeffizientBearbeiten

Hauptartikel: Phi-Koeffizient

Ein einfaches Maß, das nur für den Fall von 2 × 2 Kontingenztabellen anwendbar ist, ist der Phi-Koeffizient (φ), definiert durch

ϕ = ± χ 2 N , {\displaystyle \phi =\pm {\sqrt {\frac {\chi ^{2}}{N}}},}

$\phi =\pm {\sqrt {\frac {\chi ^{2}}{N}},$

wobei χ2 wie in Pearsons Chi-Quadrat-Test berechnet wird und N die Gesamtzahl der Beobachtungen ist. φ variiert von 0 (entsprechend keiner Assoziation zwischen den Variablen) bis 1 oder -1 (vollständige Assoziation oder vollständige inverse Assoziation), sofern er auf in 2 × 2 Tabellen dargestellten Häufigkeitsdaten basiert. Dann ist sein Vorzeichen gleich dem Vorzeichen des Produkts der Hauptdiagonalelemente der Tabelle abzüglich des Produkts der Nebendiagonalelemente. φ nimmt den Minimalwert -1,0 oder den Maximalwert von +1,0 an, wenn und nur wenn jeder Randanteil gleich 0,5 ist (und zwei Diagonalzellen leer sind).

Cramér’s V und der Kontingenzkoeffizient CEdit

Hauptartikel: Cramér’s V

Zwei Alternativen sind der Kontingenzkoeffizient C und Cramér’s V.

Die Formeln für die Koeffizienten C und V lauten:

C = χ 2 N + χ 2 {\displaystyle C={\sqrt {\frac {\chi ^{2}}{N+\chi ^{2}}}}}

$C=\sqrt{\frac {\chi ^{2}}{N+\chi ^{2}}$

und V = χ 2 N ( k – 1 ) , {\displaystyle V={\sqrt {\frac {\chi ^{2}}{N(k-1)}},}

$V={\sqrt {\frac {\chi ^{2}}{N(k-1)}}}},$

k ist die Anzahl der Zeilen oder die Anzahl der Spalten, je nachdem, was kleiner ist.

C hat den Nachteil, dass es nicht das Maximum von 1,0 erreicht, insbesondere ist der höchste Wert, den es in einer 2 × 2-Tabelle erreichen kann, 0,707 . In Kontingenztabellen mit mehr Kategorien kann es Werte erreichen, die näher an 1,0 liegen; zum Beispiel kann es in einer 4 × 4-Tabelle ein Maximum von 0,870 erreichen. Er sollte daher nicht verwendet werden, um Assoziationen in verschiedenen Tabellen zu vergleichen, wenn diese eine unterschiedliche Anzahl von Kategorien haben.

C kann so angepasst werden, dass er ein Maximum von 1,0 erreicht, wenn es eine vollständige Assoziation in einer Tabelle mit einer beliebigen Anzahl von Zeilen und Spalten gibt, indem C durch k – 1 k {\displaystyle {\sqrt {\frac {k-1}{k}}}}

$\sqrt{\frac{k-1}{k}}$

wobei k die Anzahl der Zeilen oder Spalten ist, wenn die Tabelle quadratisch ist, oder durch r – 1 r × c – 1 c 4 {\displaystyle {\sqrt{{r-1 \über r}\times {c-1 \über c}}}}

${\sqrt{{r-1 \over r}\times {c-1 \over c}}}$

wobei r die Anzahl der Zeilen und c die Anzahl der Spalten ist.

Tetrachorischer KorrelationskoeffizientBearbeiten

Hauptartikel: Polychorische Korrelation

Eine weitere Möglichkeit ist der tetrachorische Korrelationskoeffizient, der aber nur auf 2 × 2 Tabellen anwendbar ist. Die polychorische Korrelation ist eine Erweiterung der tetrachorischen Korrelation auf Tabellen mit Variablen mit mehr als zwei Stufen.

Die tetrachorische Korrelation geht davon aus, dass die jedem dichotomen Maß zugrunde liegende Variable normalverteilt ist. Der Koeffizient bietet „ein bequemes Maß für die Korrelation, wenn abgestufte Messungen auf zwei Kategorien reduziert wurden.“

Der tetrachorische Korrelationskoeffizient sollte nicht mit dem Pearson-Korrelationskoeffizienten verwechselt werden, der berechnet wird, indem man z. B. die Werte 0,0 und 1,0 zuweist, um die beiden Stufen jeder Variable zu repräsentieren (was mathematisch dem φ-Koeffizienten entspricht).

Lambda-KoeffizientBearbeiten

Hauptartikel: Lambda von Goodman und Kruskal

Der Lambda-Koeffizient ist ein Maß für die Stärke der Assoziation der Kreuztabellen, wenn die Variablen auf dem nominalen Niveau gemessen werden. Die Werte reichen von 0,0 (keine Assoziation) bis 1,0 (die maximal mögliche Assoziation).

Asymmetrisches Lambda misst die prozentuale Verbesserung bei der Vorhersage der abhängigen Variable. Symmetrisches Lambda misst die prozentuale Verbesserung, wenn die Vorhersage in beide Richtungen erfolgt.

UnsicherheitskoeffizientBearbeiten

Hauptartikel: Unsicherheitskoeffizient

Der Unsicherheitskoeffizient oder Theil’s U ist ein weiteres Maß für Variablen auf nominalem Niveau. Seine Werte reichen von -1,0 (100 % negative Assoziation, oder perfekte Inversion) bis +1,0 (100 % positive Assoziation, oder perfekte Übereinstimmung). Ein Wert von 0,0 zeigt das Fehlen einer Assoziation an.

Auch der Unschärfekoeffizient ist bedingt und ein asymmetrisches Maß der Assoziation, das wie folgt ausgedrückt werden kann

U ( X | Y ) ≠ U ( Y | X ) {\displaystyle U(X|Y)\neq U(Y|X)}

$U(X|Y)\neq U(Y|X)$

Heading