Jeśli śledziłeś relację FiveThirtyEight podczas Mistrzostw Świata, wiesz, że jesteśmy wielkimi fanami World Football Elo Ratings. Są one oparte na stosunkowo prostym systemie opracowanym przez fizyka Arpada Elo do oceny szachistów. Można je jednak dość łatwo zaadaptować do innych zawodów head-to-head, od baseballa po backgammon.
Pomyśleliśmy, że trochę się zabawimy i rozszerzymy je na futbol amerykański. W załączonym poście znajdziecie nasze wstępne oceny Elo dla wszystkich 32 drużyn NFL (w tym momencie oceny są oparte na sytuacji drużyny na koniec ostatniego sezonu, lekko obniżone, aby odzwierciedlić powrót do średniej). Stworzyliśmy również program symulacyjny, który odtwarza terminarz NFL tysiące razy i przewiduje prawdopodobieństwo, że dana drużyna dostanie się do playoffów, na podstawie jej dotychczasowego wyniku, ratingu Elo, pozostałego terminarza i różnych zasad NFL dotyczących tiebreakerów. Planujemy aktualizować te prognozy na koniec każdego tygodnia.
Ale najpierw (zainspirowani nieco przez The New York Times’a personifikacją jego modelu wyborczego, Leo), pomyśleliśmy, że przeprowadzimy „wywiad” z systemem Elo na temat tego, jak wykonuje swoją pracę.
FiveThirtyEight: Jakie są niektóre z twoich najlepszych cech?
Elo: Jestem prosty, przejrzysty i łatwy do pracy. Potrafię zrobić wiele z niewielką ilością, np. obliczyć widełki punktowe i prawdopodobieństwo wygrania meczu przez którąś z drużyn.
Czy mogę użyć Cię do pokonania Vegas?
Nie próbowałbym tego. Linie Vegas uwzględniają znacznie szerszy zakres informacji niż ja. Kiedy Nate sprawdził mnie w backtestingu, odkrył, że w 51% meczów mam rację w stosunku do rozrzutu punktów. To za mało, aby pokryć koszty zakładu, a tym bardziej, aby zarobić na życie.
Zauważyliśmy, że masz Seattle Seahawks faworyzowanych o 10 punktów w czwartkowym meczu z Green Bay Packers, podczas gdy Vegas ma Seahawks jako sześciopunktowych faworytów.
To doskonały przykład. Czy coś dziwnego dzieje się z Packers?
Cóż, ich gwiazda, rozgrywający, Aaron Rodgers, był kontuzjowany. Teraz wrócił!
Jeśli ten pan Rodgers jest tak dobry, jak mówisz, to może to tłumaczyć różnicę. Nic o nim nie wiem. Śledzę tylko końcowe wyniki, daty meczów i miejsca, w których były rozgrywane.
Więc jaki jesteś dobry?
Pomyśl o mnie jako o punkcie odniesienia. Wykonuję całkiem niezłą robotę, rozliczając się z podstawowych rzeczy – zwycięstw i porażek, marginesu zwycięstwa, siły terminarza. Zachowuję również pamięć z poprzednich sezonów, więc wiem, że Jacksonville Jaguars nie są tak prawdopodobne, aby wygrać Super Bowl jak Denver Broncos. Czy możemy przejść do bardziej technicznych pytań?
Um … jakie są twoje parametry?
To raczej tak. Jak na przykład K; K jest moim ulubionym parametrem.
Co sprawia, że K jest tak wyjątkowy?
K mówi mi, jak bardzo aktualizować moje oceny po każdym meczu. W sporcie takim jak baseball, gdzie jest wiele meczów, każdy dodatkowy mecz nie mówi ci zbyt wiele, więc K ma niską wartość. W NFL wartość ta jest znacznie wyższa. Konkretnie, jest to liczba 20. Może to nic dla Ciebie nie znaczy, ale gdybyś ustawił K dużo wyżej, byłbym nerwowym wrakiem i za bardzo bym się obijał z meczu na mecz. A gdybyś ustawił K dużo niżej, byłbym beznadziejnie ospały i zbyt wolny, aby zauważyć zmiany w jakości gry drużyny.
Zauważyłem, że Detroit Lions mają Elo na poziomie 1467. Co to oznacza?
Przeciętna drużyna ma Elo na poziomie 1500 – więc Twoje Lwy nie są takie gorące. Ale mogło być o wiele gorzej. W 2009 roku Lwy spadły aż do poziomu 1223. Większość drużyn NFL kończy w przedziale od 1300 do 1700.
Nadal nie jesteśmy do końca pewni, jak działają Twoje oceny. Jeśli masz jedną drużynę na poziomie 1650, a drugą na poziomie 1400, co to oznacza?
Jeśli to ułatwi sprawę, możesz przełożyć moje oceny na rozrzut punktów. Weź różnicę w moich ocenach i podziel przez 25. To takie proste.
Więc, jeśli jedna drużyna jest oceniana na 250 punktów Elo wyżej niż druga, to daje to rozrzut 10 punktów piłkarskich.
Precyzyjnie.
Co z przewagą własnego boiska?
Mogę to również uwzględnić. Historycznie, była ona warta około 65 punktów w rankingu Elo lub 2,6 punktów NFL. Po prostu dodaj to do rozrzutu punktów.
A co jeśli chcesz obliczyć prawdopodobieństwo wygranej drużyny?
To też jest całkiem proste, choć będziesz potrzebował do tego wzoru. W meczu pomiędzy drużyną A i drużyną B, prawdopodobieństwo wygranej drużyny A jest równe:
Pr(A) = 1 / (10^(-ELODIFF/400) + 1)
Gdzie ELODIFF to Elo rating drużyny A minus Elo rating drużyny B.
Powiedzmy, że drużyna A wygra. Jej ocena Elo poprawi się?
Tak. Jedną z moich bardziej atrakcyjnych właściwości jest to, że ocena Elo drużyny zawsze się poprawi po wygranej i zawsze spadnie po przegranej. To jak bardzo się poprawi zależy od tego jak bardzo była faworytem lub przegranym.
Więc, jak po Super Bowl 2008 …
Mogę przewidzieć do czego zmierzasz z tym pytaniem. Przyznam, że nie oceniałem New York Giants tak wysoko w porównaniu do New England Patriots. Ale ocena Elo Giants bardzo się poprawiła po wygraniu tego meczu – bardziej niż Patriots, gdyby wygrali zamiast nich. Może i mam swoje wady, ale w przeciwieństwie do wielu z was, ludzi, wiem jak je naprawić. Im niżej oceniana jest drużyna, tym łatwiej jest jej zyskać przewagę, udowadniając, że się mylę.
Czy uwzględniasz również margines zwycięstwa?
Potwierdzam. Zainspirowałem się trochę rankingami piłkarskimi, które uwzględniają różnicę bramek oprócz wyniku meczu. Ale jest to jedna z bardziej skomplikowanych części.
W przypadku NFL, zaczynam od dodania jednego punktu do marginesu zwycięstwa drużyny, a następnie biorę jego naturalny logarytm. Następnie mnożę ten wynik przez wartość K. Oznacza to, że bardziej poruszają mnie duże zwycięstwa niż małe, choć są też malejące zwroty. Nie jestem pod takim wrażeniem piątego przyłożenia, gdy drużyna prowadzi 28-0.
To wydaje się dość proste.
Byłoby, ale to nie wszystko. Nie rozmawialiśmy jeszcze o moim problemie z autokorelacją. To trochę krępujące.
Dalej. „Autokorelacja”? Czy to był ten dziwny film Davida Cronenberga?
Autokorelacja to tendencja szeregu czasowego do bycia skorelowanym z jego przeszłymi i przyszłymi wartościami. Pozwól, że ujmę to w kategoriach piłkarskich. Wyobraźmy sobie, że mam Dallas Cowboys oceniane na 1550 przed meczem z Philadelphia Eagles. Ich ocena wzrośnie, jeśli wygrają i spadnie, jeśli przegrają. Ale po meczu powinna wynosić średnio 1550. To ważne, ponieważ oznacza to, że uwzględniłem wszystkie informacje, które mi przekazałeś. Jeśli spodziewałem się, że ocena Cowboys wzrośnie średnio do 1575 po meczu, powinienem był ocenić ich wyżej na początku.
To prawda, że jeśli mam Cowboys faworyzowanych przeciwko Eagles, powinni oni wygrywać częściej niż przegrywać. Ale sposób I został pierwotnie zaprojektowany, mogę zrekompensować przez odjęcie więcej punktów za utratę niż daję im za zwycięstwo. Wszystko równoważy się dość elegancko.
Problem pojawia się, gdy staram się również uwzględnić margines zwycięstwa. Nie tylko faworyci wygrywają częściej, ale kiedy wygrywają, mają tendencję do wygrywania przez większy margines. Ponieważ daję więcej kredytów za większe zwycięstwa, oznacza to, że ich oceny są zawyżone w czasie.
Czy jest to również wada piłkarskich ocen Elo?
Możliwe. Możesz chcieć ponownie rozważyć to, co napisałeś o Niemczech.
Jak to poprawić?
W zasadzie nie jest to skomplikowane. Po prostu trzeba bardziej zdyskontować margines zwycięstwa, gdy wygrywają faworyci i zwiększyć go, gdy wygrywają underdogi. Wzór na to jest następujący:
Mnożnik marginesu zwycięstwa = LN(ABS(PD)+1) * (2.2/((ELOW-ELOL)*.001+2.2)))
Gdzie PD to różnica punktów w meczu, ELOW to Elo Rating drużyny wygrywającej przed meczem, a ELOL to Elo Rating drużyny przegrywającej przed meczem.
To trochę brzydkie, ale wszyscy mamy swoje wady.
Widzę, że masz oceny dla tegorocznych drużyn, ale nie rozegrały one jeszcze żadnego meczu! Jak to działa?
Biorę ich ocenę z końca zeszłego sezonu i lekko ją obniżam. Dokładniej mówiąc, obniżam go do średniej o jedną trzecią. Pamiętaj, że średnia ocena Elo wynosi 1500. Więc, jeśli drużyna zakończyła ostatni sezon z oceną 1800, to na początku nowego sezonu przywrócę ją do 1700. To całe pojęcie „sezonu” jest dla mnie dziwne, tak przy okazji. Nie mamy ich w szachach.
Póki co, oceny dotyczą tylko tego, które drużyny były dobre w zeszłym roku?
Technicznie rzecz biorąc, mecz wpływa na moje oceny na zawsze, tylko z coraz mniejszą wagą, która z czasem maleje do prawie zera. Ale tak, na razie moje oceny dotyczą głównie tego, kto był dobry w poprzednim sezonie. Gry pod koniec sezonu będą się bardziej liczyć, szczególnie gry podczas zeszłorocznych playoffów.
Dzięki za poświęcenie czasu! Więc mówisz, że powinniśmy wziąć Seahawks?
Co powiesz na miłą partyjkę szachów?
Zobacz rankingi Elo z pierwszego tygodnia i kursy na playoffy.
Najlepsze z FiveThirtyEight, dostarczone do Ciebie.