Contingentietabel

De mate van verband tussen de twee variabelen kan worden beoordeeld aan de hand van een aantal coëfficiënten. In de volgende subparagrafen worden er enkele beschreven. Zie voor een vollediger bespreking van hun toepassingen de hoofdartikelen waarnaar onder elke subkop wordt verwezen.

KansverhoudingEdit

Main article: Odds ratio

De eenvoudigste associatiemaat voor een 2 × 2 contingentietabel is de odds ratio. Gegeven twee gebeurtenissen, A en B, wordt de odds ratio gedefinieerd als de verhouding van de kans op A in aanwezigheid van B en de kans op A in afwezigheid van B, of equivalent (vanwege symmetrie), de verhouding van de kans op B in aanwezigheid van A en de kans op B in afwezigheid van A. Twee gebeurtenissen zijn onafhankelijk als en slechts als de odds ratio 1 is; als de odds ratio groter is dan 1, zijn de gebeurtenissen positief geassocieerd; als de odds ratio kleiner is dan 1, zijn de gebeurtenissen negatief geassocieerd.

De odds ratio heeft een eenvoudige uitdrukking in termen van waarschijnlijkheden; gegeven de gezamenlijke waarschijnlijkheidsverdeling:

B = 1 B = 0 A = 1 p 11 p 10 A = 0 p 01 p 00 {\displaystyle {begin{array}{c|cc}&B=1&B=0 A=1&p_{11}&p_{10}\\A=0&p_{01}&p_{00}\end{array}}}

${{displaystyle {begin{array}{c|cc}B=1B=0}}}}}$

de odds ratio is:

O R = p 11 p 00 p 10 p 01 . {\displaystyle OR={\frac {p_{11}p_{00}}{p_{10}p_{01}}.}

$OR={\frac {p_{11}p_{00}}{p_{10}p_{01}}.$

Phi coëfficiëntEdit

Main article: Phi-coëfficiënt

Een eenvoudige maat, alleen van toepassing op het geval van 2 × 2 contingentietabellen, is de phi-coëfficiënt (φ) gedefinieerd door

ϕ = ± χ 2 N , {\displaystyle \phi =\pm {\sqrt {\frac {\chi ^{2}}{N}}},}

$\phi =\pm {\sqrt {\frac {chi ^{2}}{N}},$

waarbij χ2 wordt berekend zoals in Pearson’s chi-kwadraattoets, en N het totaal aantal waarnemingen is. φ varieert van 0 (overeenkomend met geen verband tussen de variabelen) tot 1 of -1 (volledig verband of volledig omgekeerd verband), mits zij gebaseerd is op frequentiegegevens die in 2 × 2-tabellen zijn weergegeven. Het teken ervan is dan gelijk aan het teken van het product van de hoofddiagonaalelementen van de tabel min het product van de off-diagonaalelementen. φ neemt de minimumwaarde -1,0 of de maximumwaarde +1,0 aan als en slechts als elke marginale proportie gelijk is aan 0,5 (en twee diagonaalcellen leeg zijn).

De V van Cramér en de contingentiecoëfficiënt CEdit

Main article: De V van Cramér

Twee alternatieven zijn de contingentiecoëfficiënt C, en de V van Cramér.

De formules voor de coëfficiënten C en V zijn:

C = χ 2 N + χ 2 {\displaystyle C={\sqrt {\frac {\chi ^{2}}{N+\chi ^{2}}}}}

$C=\sqrt{\frac{\chi^{2}{N+\chi^2}}$

en V = χ 2 N ( k – 1 ) , {\displaystyle V={\sqrt {\frac {chi ^{2}}{N(k-1)}}},}

$V={\sqrt {{\frac {\chi ^{2}}{N(k-1)}}}},$

k is het aantal rijen of het aantal kolommen, afhankelijk van welke kleiner is.

C heeft het nadeel dat het niet het maximum van 1,0 bereikt, met name het hoogste dat het in een 2 × 2-tabel kan bereiken is 0,707 . In contingentietabellen met meer categorieën kan het waarden dichter bij 1,0 bereiken; in een 4 × 4-tabel kan het bijvoorbeeld een maximum van 0,870 bereiken.

C kan zodanig worden aangepast dat hij bij een volledige associatie in een tabel met een willekeurig aantal rijen en kolommen een maximum van 1,0 bereikt door C te delen door k – 1 k {{k}}}}

$\sqrt{\frac{k-1}{k}}$

waarbij k het aantal rijen of kolommen is, als de tabel vierkant is, of door r – 1 r × c – 1 c 4 {\displaystyle {\sqrt{r-1 \over r}\times {c-1 \over c}}}}

${\sqrt{r-1 \over r}\times {c-1 \over c}}}$

waarbij r het aantal rijen is en c het aantal kolommen.

Tetrachorische correlatiecoëfficiëntEdit

Main article: Polychorische correlatie

Een andere keuze is de tetrachorische correlatiecoëfficiënt, maar die is alleen van toepassing op 2 × 2 tabellen. Polychorische correlatie is een uitbreiding van de tetrachorische correlatie tot tabellen met variabelen met meer dan twee niveaus.

Tetrachorische correlatie gaat ervan uit dat de variabele die aan elke dichotome maat ten grondslag ligt, normaal verdeeld is. De coëfficiënt biedt “een handige maatstaf voor correlatie wanneer gegradueerde metingen zijn teruggebracht tot twee categorieën.”

De tetrachorische correlatiecoëfficiënt moet niet worden verward met de Pearson-correlatiecoëfficiënt die wordt berekend door bijvoorbeeld waarden 0,0 en 1,0 toe te kennen aan de twee niveaus van elke variabele (die wiskundig gelijkwaardig is aan de φ-coëfficiënt).

Lambda-coëfficiëntEdit

Main article: Goodman en Kruskal’s lambda

De lambda-coëfficiënt is een maat voor de sterkte van de associatie van de kruistabellen wanneer de variabelen op nominaal niveau worden gemeten. Waarden lopen van 0,0 (geen associatie) tot 1,0 (de maximaal mogelijke associatie).

Asymmetrische lambda meet de procentuele verbetering in het voorspellen van de afhankelijke variabele. Symmetrische lambda meet de procentuele verbetering wanneer de voorspelling in beide richtingen wordt gedaan.

OnzekerheidscoëfficiëntEdit

Main article: Onzekerheidscoëfficiënt

De onzekerheidscoëfficiënt, of Theil’s U, is een andere maat voor variabelen op nominaal niveau. De waarden variëren van -1,0 (100% negatieve associatie, of perfecte inversie) tot +1,0 (100% positieve associatie, of perfecte overeenstemming). Een waarde van 0,0 duidt op de afwezigheid van associatie.

Ook de onzekerheidscoëfficiënt is voorwaardelijk en een asymmetrische maat voor associatie, die kan worden uitgedrukt als

U ( X | Y ) ≠ U ( Y | X ) {{displaystyle U(X|Y)\neq U(Y|X)}

$U(X|Y)\neq U(Y|X)$

Heading