Als je de verslaggeving van FiveThirtyEight tijdens het WK voetbal hebt gevolgd, weet je dat we grote fans zijn van de Elo-ratings van het wereldvoetbal. Ze zijn gebaseerd op een relatief eenvoudig systeem dat door de natuurkundige Arpad Elo is ontwikkeld om schakers te beoordelen. Maar ze kunnen vrij eenvoudig worden aangepast voor andere competities, van honkbal tot backgammon.

We dachten dat we een beetje plezier konden hebben en ze konden uitbreiden naar Amerikaans voetbal. In een begeleidend bericht vind je onze eerste Elo-ratings voor alle 32 NFL-teams (op dit moment zijn de ratings gebaseerd op de status van een team aan het eind van het vorige seizoen, enigszins gedisconteerd om de terugkeer naar het gemiddelde weer te geven). We hebben ook een simulatieprogramma ontwikkeld dat het NFL-schema duizenden keren uitspeelt en de kans voorspelt dat een team de play-offs haalt, gebaseerd op het record van het team tot op dat moment, de Elo-rating, het resterende schema en de verschillende tiebreaker-regels van de NFL. We zijn van plan deze prognoses aan het eind van elke week te updaten.

Maar eerst (enigszins geïnspireerd door Leo, de personificatie van het verkiezingsmodel van The New York Times), dachten we het Elo-systeem te “interviewen” over hoe het zijn werk doet.

FiveThirtyEight: Wat zijn enkele van uw beste kwaliteiten?

Elo: Ik ben eenvoudig, transparant en gemakkelijk om mee te werken. Ik kan veel doen met weinig, zoals het berekenen van point spreads en de kans dat een van beide teams een wedstrijd wint.

Kan ik je gebruiken om Vegas te verslaan?

Dat zou ik niet proberen. Vegas regels houden rekening met een veel breder scala aan informatie dan ik. Toen Nate me backtestte, ontdekte hij dat ik 51 procent van de wedstrijden goed had tegen de point spread. Dat is lang niet genoeg om het huis te dekken, laat staan om van te leven.

Het viel ons op dat jij de Seattle Seahawks tien punten voor hebt staan in hun wedstrijd van donderdag tegen de Green Bay Packers, terwijl Vegas de Seahawks zes punten voor heeft staan.

Dat is een perfect voorbeeld. Is er iets vreemds aan de hand met de Packers?

Wel, hun ster quarterback, Aaron Rodgers, was geblesseerd. Nu is hij terug!

Als die Mr. Rodgers zo goed is als jij zegt, zou dat het verschil kunnen verklaren. Ik weet niets over hem. Ik hou alleen de eindscores bij, de speeldata en waar de wedstrijden zijn gespeeld.

Dus wat heb jij eraan?

Denk aan mij als een maatstaf. Ik kan vrij goed de basisgegevens bijhouden – winst en verlies, winstmarge, sterkte van het schema. Ik heb ook een geheugen van de afgelopen seizoenen, dus ik weet dat de Jacksonville Jaguars niet zo waarschijnlijk de Super Bowl winnen als de Denver Broncos. Kunnen we wat meer technische vragen stellen?

Um … wat zijn je parameters?

Dat lijkt er meer op. Zoals K, bijvoorbeeld; K is mijn favoriete parameter.

Wat maakt K zo speciaal?

K vertelt me hoeveel ik mijn ratings moet bijwerken na elke wedstrijd. In een sport als honkbal, waar veel wedstrijden worden gespeeld, zegt één extra wedstrijd niet zo veel, dus heeft K een lage waarde. In de NFL, is het veel hoger. Om precies te zijn, het is het nummer 20. Dat zegt jou misschien niets, maar als je K veel hoger zou zetten dan dat, zou ik een nerveus wrak worden en te veel van wedstrijd tot wedstrijd stuiteren. En als je K veel lager zou zetten, zou ik hopeloos traag zijn en te traag om veranderingen in de kwaliteit van het spel van het team op te merken.

Ik zag dat de Detroit Lions een Elo-rating van 1467 hebben. Wat betekent dat?

Een gemiddeld team heeft een Elo-rating van 1500 – dus jullie Lions zijn niet zo goed. Maar het kan nog veel erger. In 2009 daalden de Lions tot een rating van 1223. De meeste NFL-teams eindigen tussen 1300 en 1700.

We weten nog steeds niet precies hoe jullie ratings werken. Als je een team op 1650 hebt staan en een ander op 1400, wat betekent dat dan?

Als het makkelijker is, kun je mijn ratings vertalen in een puntenspreiding. Neem het verschil in mijn ratings en deel door 25. Zo simpel is het.

Dus als het ene team 250 Elo-punten hoger wordt ingeschat dan het andere, dan komt dat neer op een verschil van 10 voetbalpunten.

Precies.

Hoe zit het met het thuisvoordeel?

Daar kan ik ook rekening mee houden. Historisch gezien is het ongeveer 65 Elo punten waard of 2.6 NFL punten. Voeg dat gewoon toe aan de puntenspreiding.

Wat als je de winkans van een team wilt berekenen?

Dat is ook vrij eenvoudig, hoewel je er een formule voor nodig hebt. In een wedstrijd tussen Team A en Team B is de winstkans voor Team A gelijk aan:

Pr(A) = 1 / (10^(-ELODIFF/400) + 1)

Waarbij ELODIFF de Elo-rating van Team A is minus de Elo-rating van Team B.

Laten we zeggen dat Team A wint. Wordt de Elo-rating dan beter?

Ja. Een van mijn aantrekkelijker eigenschappen is dat de Elo-rating van een team altijd zal verbeteren als het wint en altijd zal dalen als het verliest. Hoeveel het verbetert, hangt af van hoe favoriet of underdog het was.

Dus, zoals na de Super Bowl van 2008 …

Ik kan voorspellen waar je heen wilt met die vraag. Ik geef toe dat ik de New York Giants niet zo hoog had ingeschat in vergelijking met de New England Patriots. Maar de Elo-rating van de Giants is sterk verbeterd nadat ze die wedstrijd wonnen – meer dan die van de Patriots zou zijn verbeterd als ze in plaats daarvan hadden gewonnen. Ik mag dan mijn gebreken hebben, maar in tegenstelling tot veel van jullie mensen, weet ik hoe ze te herstellen. Hoe lager een team wordt ingeschat, hoe makkelijker het terrein kan winnen door mijn ongelijk te bewijzen.

Houdt u ook rekening met de winstmarge?

Aangenomen. Ik heb me wat laten inspireren door de voetbalratings, die naast het resultaat ook rekening houden met het doelsaldo. Maar dit is een van de gecompliceerdere onderdelen.

Voor de NFL begin ik met één punt toe te voegen aan de winstmarge van het team en dan de natuurlijke logaritme te nemen. Daarna vermenigvuldig ik dat resultaat met de K-waarde. Dat betekent dat ik meer onder de indruk ben van grote overwinningen dan van kleine, hoewel er een afnemende opbrengst is. Ik ben niet zo onder de indruk van de vijfde touchdown als een team met 28-0 voorstaat.

Dat lijkt eenvoudig genoeg.

Dat zou het ook zijn, maar dat is niet het enige. We hebben het nog niet over mijn autocorrelatieprobleem gehad. Het is een beetje gênant.

Ga verder. “Autocorrelatie”? Was dat die rare David Cronenberg film?

Autocorrelatie is de neiging van een tijdreeks om gecorreleerd te zijn met zijn vroegere en toekomstige waarden. Laat me dit in voetbaltermen uitdrukken. Stel dat ik de Dallas Cowboys voor een wedstrijd tegen de Philadelphia Eagles op 1550 heb gewaardeerd. Hun rating zal stijgen als ze winnen en dalen als ze verliezen. Maar het zou gemiddeld 1550 moeten zijn na de wedstrijd. Dat is belangrijk, want het betekent dat ik efficiënt rekening heb gehouden met alle informatie die je me hebt gegeven. Als ik had verwacht dat de rating van de Cowboys na de wedstrijd zou stijgen tot gemiddeld 1575, dan had ik ze om te beginnen hoger moeten inschatten.

Het is waar dat als ik de Cowboys bevoordeel tegen de Eagles, ze vaker zouden moeten winnen dan verliezen. Maar zoals ik oorspronkelijk was ontworpen, kan ik dat compenseren door bij verlies meer punten af te trekken dan ik ze bij winst geef.

Het probleem ontstaat wanneer ik ook rekening probeer te houden met de winstmarge. Niet alleen winnen favorieten vaker, maar als ze winnen, winnen ze meestal ook met een grotere marge. Omdat ik grotere overwinningen meer krediet geef, betekent dit dat hun ratings in de loop der tijd worden opgeblazen.

Is dit ook een fout in de Elo-ratings van het voetbal?

Mogelijk. Misschien moet je nog eens nadenken over wat je over Duitsland hebt geschreven.

Hoe corrigeer je dit dan?

In principe is het niet ingewikkeld. Je moet gewoon de winstmarge meer verdisconteren als de favorieten winnen en meer verdisconteren als de underdogs winnen. De formule is als volgt:

Winstmarge Multiplier = LN(ABS(PD)+1) * (2.2/((ELOW-ELOL)*.001+2.2))

Waarbij PD het puntenverschil in de wedstrijd is, ELOW de Elo Rating van het winnende team voor de wedstrijd is, en ELOL de Elo Rating van het verliezende team voor de wedstrijd is.

Het is een beetje lelijk, maar we hebben allemaal onze ondeugden.

Ik zie dat je ratings hebt voor de teams van dit jaar, maar ze hebben nog geen wedstrijden gespeeld! Hoe werkt dat?

Ik neem hun rating van het eind van vorig seizoen en trek die iets terug. Om precies te zijn, ik zet het terug naar het gemiddelde met een derde. Vergeet niet dat de gemiddelde Elo-rating 1500 is. Dus, als een team vorig seizoen eindigde met een rating van 1800, dan zet ik het terug naar 1700 als het nieuwe seizoen begint. Dit hele begrip “seizoen” is trouwens vreemd voor mij. Bij schaken hebben we die niet.

Voorlopig gaan de ratings alleen nog maar over welke teams vorig jaar goed waren?

Technisch gesproken heeft een wedstrijd voor altijd invloed op mijn ratings als hij eenmaal gespeeld is, alleen met een steeds kleiner gewicht dat geleidelijk afneemt tot bijna niets in de loop van de tijd. Maar ja, op dit moment gaan mijn ratings vooral over wie er vorig seizoen goed was. Wedstrijden aan het eind van het seizoen zullen meer meetellen, vooral wedstrijden tijdens de play-offs van vorig jaar.

Bedankt voor je tijd! Dus je zegt dat we de Seahawks moeten nemen?

Wat dacht je van een potje schaak?

Zie de Week 1 Elo-ratings en play-offkansen.

×

Het beste van FiveThirtyEight, bij u bezorgd.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *