Wenn Sie die Berichterstattung von FiveThirtyEight während der WM verfolgt haben, wissen Sie, dass wir große Fans der World Football Elo Ratings sind. Sie basieren auf einem relativ einfachen System, das von dem Physiker Arpad Elo entwickelt wurde, um Schachspieler zu bewerten. Aber sie lassen sich ziemlich einfach für andere Kopf-an-Kopf-Wettbewerbe von Baseball bis Backgammon anpassen.
Wir dachten uns, wir machen ein bisschen Spaß und erweitern sie auf American Football. In einem begleitenden Beitrag finden Sie unsere ersten Elo-Ratings für alle 32 NFL-Teams (zu diesem Zeitpunkt basieren die Ratings auf dem Stand eines Teams am Ende der letzten Saison, leicht diskontiert, um die Rückkehr zum Mittelwert zu reflektieren). Wir haben auch ein Simulationsprogramm entwickelt, das den NFL-Spielplan tausende Male durchspielt und die Wahrscheinlichkeit eines Teams, die Playoffs zu erreichen, basierend auf der bisherigen Bilanz eines Teams, seinem Elo-Rating, seinem verbleibenden Spielplan und den verschiedenen Tiebreaker-Regeln der NFL, prognostiziert. Wir planen, diese Prognosen am Ende jeder Woche zu aktualisieren.
Aber zuerst (inspiriert durch die Personifizierung des Wahlmodells der New York Times, Leo), dachten wir, wir „interviewen“ das Elo-System darüber, wie es seine Arbeit macht.
FiveThirtyEight: Was sind einige Ihrer besten Eigenschaften?
Elo: Ich bin einfach, transparent und leicht zu bedienen. Ich kann mit wenig viel machen, wie z.B. die Berechnung von Point Spreads und die Wahrscheinlichkeit, dass eines der beiden Teams ein Spiel gewinnt.
Kann ich Sie benutzen, um Vegas zu schlagen?
Das würde ich nicht versuchen. Die Vegas-Linien berücksichtigen eine viel größere Bandbreite an Informationen als ich. Als Nate mich getestet hat, hat er herausgefunden, dass ich in 51 Prozent der Spiele gegen die Punkteverteilung richtig lag. Das ist nicht annähernd genug, um den Anteil des Hauses zu decken, geschweige denn, um davon leben zu können.
Wir haben bemerkt, dass Sie die Seattle Seahawks in ihrem Spiel am Donnerstagabend gegen die Green Bay Packers mit 10 Punkten favorisiert haben, während Vegas die Seahawks stattdessen als Sechs-Punkte-Favoriten sieht.
Das ist ein perfektes Beispiel. Ist irgendetwas Seltsames mit den Packers passiert?
Nun, ihr Star-Quarterback, Aaron Rodgers, war verletzt. Jetzt ist er wieder da!
Wenn dieser Mr. Rodgers so gut ist, wie Sie sagen, könnte das den Unterschied erklären. Ich weiß nichts über ihn. Ich behalte nur die Endergebnisse im Auge, die Daten der Spiele und wo die Spiele gespielt wurden.
So was taugen Sie?
Betrachten Sie mich als Benchmark. Ich mache einen ziemlich guten Job, wenn es um die grundlegenden Dinge geht – Siege und Niederlagen, Gewinnspanne, Stärke des Spielplans. Ich habe auch ein Gedächtnis für vergangene Saisons, also weiß ich, dass die Jacksonville Jaguars nicht so wahrscheinlich den Super Bowl gewinnen werden wie die Denver Broncos. Können wir zu ein paar mehr technischen Fragen kommen?
Um … was sind Ihre Parameter?
Das ist schon eher so. Zum Beispiel K; K ist mein Lieblingsparameter.
Was macht K so besonders?
K sagt mir, wie sehr ich meine Bewertungen nach jedem Spiel aktualisieren muss. In einer Sportart wie Baseball, wo es viele Spiele gibt, sagt ein einziges zusätzliches Spiel nicht allzu viel aus, daher hat K einen geringen Wert. In der NFL ist der Wert viel höher. Genauer gesagt, ist es die Zahl 20. Das mag Ihnen nichts sagen, aber wenn Sie K viel höher ansetzen würden, wäre ich ein nervöses Wrack und würde von Spiel zu Spiel zu sehr hin- und herschwanken. Und wenn Sie K viel niedriger ansetzen würden, wäre ich hoffnungslos träge und zu langsam, um Veränderungen in der Spielqualität der Mannschaft zu bemerken.
Ich habe bemerkt, dass die Detroit Lions eine Elo-Zahl von 1467 haben. Was bedeutet das?
Ein durchschnittliches Team hat eine Elo-Bewertung von 1500 – Ihre Lions sind also nicht so toll. Aber es könnte noch viel schlimmer sein. Im Jahr 2009 sind die Lions bis auf ein Rating von 1223 heruntergekommen. Die meisten NFL-Teams landen im Bereich von 1300 bis 1700.
Wir sind uns immer noch nicht ganz sicher, wie Ihre Ratings funktionieren. Wenn Sie ein Team mit 1650 und ein anderes mit 1400 bewerten, was bedeutet das?
Wenn es die Sache einfacher macht, können Sie meine Bewertungen in eine Punktedifferenz umrechnen. Nehmen Sie den Unterschied in meinen Ratings und teilen Sie durch 25. So einfach ist das.
Wenn also ein Team 250 Elo-Punkte höher bewertet wird als das andere, ergibt das eine Spanne von 10 Fußballpunkten.
Genau.
Was ist mit dem Heimvorteil?
Auch den kann ich berücksichtigen. Historisch gesehen ist er etwa 65 Elo-Punkte oder 2,6 NFL-Punkte wert.
Was ist, wenn Sie die Gewinnwahrscheinlichkeit eines Teams berechnen wollen?
Das ist auch ziemlich einfach, obwohl Sie dafür eine Formel brauchen. In einem Spiel zwischen Team A und Team B ist die Gewinnwahrscheinlichkeit von Team A gleich:
Pr(A) = 1 / (10^(-ELODIFF/400) + 1)
Wobei ELODIFF die Elo-Wertung von Team A minus die Elo-Wertung von Team B ist.
Angenommen, Team A gewinnt. Seine Elo-Bewertung wird sich verbessern?
Ja. Eine meiner reizvollsten Eigenschaften ist, dass sich die Elo-Bewertung eines Teams nach einem Sieg immer verbessert und nach einer Niederlage immer verschlechtert. Wie sehr sie sich verbessert, hängt davon ab, wie sehr sie Favorit oder Außenseiter war.
So wie nach dem Super Bowl 2008 …
Ich kann mir denken, worauf Sie mit dieser Frage hinauswollen. Ich gebe zu, dass ich die New York Giants im Vergleich zu den New England Patriots nicht so hoch eingeschätzt habe. Aber die Elo-Bewertung der Giants hat sich nach dem Sieg in diesem Spiel stark verbessert – mehr als die der Patriots, wenn sie stattdessen gewonnen hätten. Ich mag meine Fehler haben, aber im Gegensatz zu vielen von euch Menschen weiß ich, wie man sie behebt. Je niedriger ein Team eingestuft wird, desto leichter kann es an Boden gewinnen, indem es mir das Gegenteil beweist.
Berechnen Sie auch den Vorsprung des Siegers?
Bejahend. Ich habe mich ein wenig von den Fußball-Ratings inspirieren lassen, die neben dem Spielergebnis auch die Tordifferenz berücksichtigen. Aber das ist einer der komplizierteren Teile.
Für die NFL fange ich an, indem ich einen Punkt zur Siegquote des Teams addiere und dann seinen natürlichen Logarithmus nehme. Dann multipliziere ich dieses Ergebnis mit dem K-Wert. Das bedeutet, dass mich große Siege mehr bewegen als knappe, obwohl es abnehmende Erträge gibt. Ich bin nicht so beeindruckt vom fünften Touchdown, wenn ein Team 28:0 in Führung liegt.
Das scheint einfach genug zu sein.
Das wäre es auch, aber das ist nicht alles. Wir haben noch nicht über mein Autokorrelationsproblem gesprochen. Es ist ein bisschen peinlich.
Fahren Sie fort. „Autokorrelation“? War das der schräge David-Cronenberg-Film?
Autokorrelation ist die Tendenz einer Zeitreihe, mit ihren vergangenen und zukünftigen Werten korreliert zu sein. Lassen Sie mich das in Fußballbegriffen ausdrücken. Stellen Sie sich vor, ich habe die Dallas Cowboys vor einem Spiel gegen die Philadelphia Eagles auf 1550 bewertet. Ihr Rating wird steigen, wenn sie gewinnen und sinken, wenn sie verlieren. Aber nach dem Spiel sollte es im Durchschnitt 1550 sein. Das ist wichtig, denn es bedeutet, dass ich alle Informationen, die Sie mir gegeben haben, effizient berücksichtigt habe. Wenn ich erwartet hätte, dass das Rating der Cowboys nach dem Spiel auf durchschnittlich 1575 ansteigt, hätte ich sie von Anfang an höher bewerten müssen.
Es stimmt, wenn ich die Cowboys gegen die Eagles favorisiere, sollten sie öfter gewinnen als verlieren. Aber so wie ich ursprünglich konzipiert wurde, kann ich das kompensieren, indem ich mehr Punkte für eine Niederlage abziehe als ich ihnen für einen Sieg gebe. Das gleicht sich alles ziemlich elegant aus.
Das Problem kommt, wenn ich auch die Gewinnspanne berücksichtigen will. Die Favoriten gewinnen nicht nur häufiger, sondern wenn sie gewinnen, dann auch mit einem größeren Vorsprung. Da ich mehr Kredit für größere Siege gebe, bedeutet dies, dass ihre Bewertungen im Laufe der Zeit aufgebläht werden.
Ist dies auch ein Fehler bei den Fußball-Elo-Bewertungen?
Wahrscheinlich. Sie sollten vielleicht noch einmal überdenken, was Sie über Deutschland geschrieben haben.
Wie korrigieren Sie das?
Es ist im Prinzip nicht kompliziert. Man muss nur die Gewinnspanne bei Favoritensiegen stärker abziehen und bei Außenseitersiegen erhöhen. Die Formel dafür lautet wie folgt:
Siegspannenmultiplikator = LN(ABS(PD)+1) * (2.2/((ELOW-ELOL)*.001+2.2))
Wobei PD die Punktedifferenz im Spiel ist, ELOW der Elo-Wert des Siegerteams vor dem Spiel und ELOL der Elo-Wert des Verliererteams vor dem Spiel.
Es ist ein bisschen hässlich, aber wir haben alle unsere Laster.
Ich sehe, dass Sie Bewertungen für die diesjährigen Teams haben, aber sie haben noch keine Spiele gespielt! Wie funktioniert das?
Ich nehme ihre Bewertung vom Ende der letzten Saison und ziehe sie leicht ab. Genauer gesagt, ich ziehe sie um ein Drittel auf den Mittelwert zurück. Denken Sie daran, dass die durchschnittliche Elo-Bewertung 1500 beträgt. Wenn also ein Team die letzte Saison mit einer Wertung von 1800 abgeschlossen hat, werde ich sie zu Beginn der neuen Saison auf 1700 zurücksetzen. Diese ganze Vorstellung von „Saison“ ist übrigens seltsam für mich. Im Schach haben wir so etwas nicht.
Zurzeit geht es bei den Ratings nur darum, welche Teams letztes Jahr gut waren…
Technisch gesehen beeinflusst ein Spiel meine Ratings für immer, wenn es einmal gespielt wurde, nur mit einem kleineren und kleineren Gewicht, das mit der Zeit auf fast nichts abnimmt. Aber, ja, im Moment geht es bei meinen Bewertungen hauptsächlich darum, wer in der letzten Saison gut war. Spiele gegen Ende der Saison werden mehr zählen, besonders Spiele während der letztjährigen Playoffs.
Danke, dass Sie sich die Zeit genommen haben! Sie meinen also, wir sollten die Seahawks nehmen?
Wie wäre es mit einer netten Partie Schach?
Sehen Sie die Elo-Ratings der Woche 1 und die Playoff-Quoten.
Das Beste von FiveThirtyEight, für Sie bereitgestellt.