Si vous avez suivi la couverture de FiveThirtyEight pendant la Coupe du monde, vous savez que nous sommes de grands fans de la notation Elo du football mondial. Ils sont basés sur un système relativement simple développé par le physicien Arpad Elo pour évaluer les joueurs d’échecs. Mais ils peuvent être adaptés assez facilement pour d’autres compétitions en tête-à-tête, du baseball au backgammon.
Nous avons pensé nous amuser un peu et les étendre au football américain. Dans un post d’accompagnement, vous trouverez nos notes Elo initiales pour les 32 équipes de la NFL (à ce stade, les notes sont basées sur le classement d’une équipe à la fin de la saison dernière, légèrement escompté pour refléter le retour à la moyenne). Nous avons également mis au point un programme de simulation qui joue le calendrier de la NFL des milliers de fois et projette les chances d’une équipe de participer aux séries éliminatoires, en fonction de son bilan jusqu’à ce moment-là, de son classement Elo, de son calendrier restant et des différentes règles de départage de la NFL. Nous prévoyons de mettre à jour ces projections à la fin de chaque semaine.
Mais d’abord (en nous inspirant quelque peu de la personnification de son modèle d’élection par le New York Times, Leo), nous avons pensé « interviewer » le système Elo sur la façon dont il fait son travail.
FiveThirtyEight : Quelles sont certaines de vos meilleures qualités ?
Elo : Je suis simple, transparent et il est facile de travailler avec moi. Je peux faire beaucoup avec peu, comme calculer les écarts de points et la probabilité qu’une des deux équipes gagne un match.
Peut-on vous utiliser pour battre Vegas ?
Je n’essaierais pas cela. Les lignes de Vegas tiennent compte d’un éventail d’informations beaucoup plus large que le mien. Lorsque Nate m’a backtesté, il a constaté que j’avais raison dans 51 % des matchs contre l’écart de points. C’est loin d’être suffisant pour couvrir la coupe de la maison, et encore moins pour gagner sa vie.
Nous avons remarqué que vous avez les Seahawks de Seattle favoris de 10 points dans leur match de jeudi soir contre les Packers de Green Bay, alors que Vegas a plutôt les Seahawks comme favoris de six points.
C’est un exemple parfait. Est-ce que quelque chose d’étrange s’est passé avec les Packers ?
Eh bien, leur quarterback vedette, Aaron Rodgers, était blessé. Maintenant il est de retour !
Si ce M. Rodgers est aussi bon que vous le dites, cela pourrait expliquer la différence. Je ne sais rien de lui. Je ne garde trace que des scores finaux, des dates des matchs et des lieux où ils ont été joués.
Alors, à quoi servez-vous ?
Pensez à moi comme à un point de référence. Je fais un assez bon travail de comptabilisation des éléments de base – victoires et défaites, marge de victoire, force du calendrier. Je garde également en mémoire les saisons passées, je sais donc que les Jacksonville Jaguars n’ont pas autant de chances de remporter le Super Bowl que les Denver Broncos. Pouvons-nous passer à des questions plus techniques ?
Um… quels sont vos paramètres ?
C’est plutôt ça. Comme K, par exemple ; K est mon paramètre préféré.
Qu’est-ce qui rend K si spécial ?
K m’indique dans quelle mesure je dois mettre à jour mes évaluations après chaque match. Dans un sport comme le baseball, où il y a beaucoup de matchs, tout match supplémentaire ne vous dit pas grand-chose, donc K prend une faible valeur. Dans la NFL, il est beaucoup plus élevé. Plus précisément, c’est le chiffre 20. Cela ne signifie peut-être rien pour vous, mais si vous fixez le K beaucoup plus haut que cela, je deviendrais une épave nerveuse et je rebondirais trop d’un match à l’autre. Et si vous fixiez K beaucoup plus bas, je serais désespérément léthargique et trop lent pour remarquer les changements dans la qualité du jeu de l’équipe.
J’ai remarqué que les Lions de Détroit ont une cote Elo de 1467. Qu’est-ce que cela signifie ?
Une équipe moyenne a une cote Elo de 1500 – donc vos Lions ne sont pas si chauds. Mais cela pourrait être bien pire. En 2009, les Lions sont descendus jusqu’à une cote de 1223. La plupart des équipes de la NFL finissent dans une fourchette de 1300 à 1700.
Nous ne savons pas encore très bien comment fonctionnent vos cotes. Si vous avez une équipe à 1650 et une autre à 1400, qu’est-ce que cela signifie ?
Si cela facilite les choses, vous pouvez traduire mes évaluations en un écart de points. Prenez la différence entre mes cotes et divisez-la par 25. C’est aussi simple que cela.
Donc, si une équipe est évaluée 250 points Elo de plus que l’autre, cela donne un écart de 10 points de football.
Précisément.
Qu’en est-il de l’avantage du terrain ?
Je peux aussi en tenir compte. Historiquement, il vaut environ 65 points d’évaluation Elo ou 2,6 points NFL. Il suffit d’ajouter cela à l’écart de points.
Et si vous voulez calculer la probabilité de victoire d’une équipe ?
C’est assez facile aussi, même si vous aurez besoin d’une formule pour cela. Dans un match entre l’équipe A et l’équipe B, la probabilité de victoire de l’équipe A est égale à :
Pr(A) = 1 / (10^(-ELODIFF/400) + 1)
Où ELODIFF est la cote Elo de l’équipe A moins la cote Elo de l’équipe B.
Disons que l’équipe A gagne. Sa cote Elo va s’améliorer ?
Oui. L’une de mes propriétés les plus attrayantes est que la cote Elo d’une équipe s’améliorera toujours après sa victoire et diminuera toujours après sa défaite. La mesure dans laquelle elle s’améliorera dépendra de son statut de favori ou d’outsider.
Donc, comme après le Super Bowl 2008…
Je peux prédire où vous allez avec cette question. J’admets que je n’avais pas une cote aussi élevée pour les New York Giants par rapport aux New England Patriots. Mais la cote Elo des Giants s’est beaucoup améliorée après qu’ils ont gagné ce match – plus que celle des Patriots s’ils avaient gagné à la place. J’ai peut-être des défauts, mais contrairement à beaucoup d’entre vous, je sais comment les corriger. Plus une équipe est mal notée, plus il lui est facile de gagner du terrain en prouvant que j’ai tort.
Vous tenez également compte de la marge de victoire ?
Affirmatif. Je me suis un peu inspiré des notations du football, qui prennent en compte le différentiel de buts en plus du résultat du match. Mais c’est l’une des parties les plus compliquées.
Pour la NFL, je commence par ajouter un point à la marge de victoire de l’équipe, puis je prends son logarithme naturel. Ensuite, je multiplie ce résultat par la valeur K. Cela signifie que je suis plus ému par les grandes victoires que par les petites, bien qu’il y ait des rendements décroissants. Je ne suis pas aussi impressionné par le cinquième touchdown lorsqu’une équipe mène 28-0.
Cela semble assez simple.
Ça le serait, mais il n’y a pas que cela. Nous n’avons pas parlé de mon problème d’autocorrélation. C’est un peu embarrassant.
Allez-y. « Autocorrélation » ? C’était le film bizarre de David Cronenberg ?
L’autocorrélation est la tendance d’une série temporelle à être corrélée avec ses valeurs passées et futures. Permettez-moi d’exprimer cela en termes de football. Imaginez que j’ai les Dallas Cowboys notés à 1550 avant un match contre les Philadelphia Eagles. Leur cote augmentera s’ils gagnent et baissera s’ils perdent. Mais elle devrait être de 1550 après le match, en moyenne. C’est important, car cela signifie que j’ai tenu compte efficacement de toutes les informations que vous m’avez données. Si je m’attendais à ce que la cote des Cowboys atteigne 1575 en moyenne après le match, j’aurais dû leur attribuer une cote plus élevée au départ.
Il est vrai que si j’ai les Cowboys favoris contre les Eagles, ils devraient gagner plus souvent qu’ils ne perdent. Mais de la façon dont j’ai été conçu à l’origine, je peux compenser en soustrayant plus de points pour une perte que je leur donne pour une victoire. Tout s’équilibre de manière plutôt élégante.
Le problème survient lorsque je cherche également à tenir compte de la marge de victoire. Non seulement les favoris gagnent plus souvent, mais lorsqu’ils gagnent, ils ont tendance à gagner avec une plus grande marge. Comme je donne plus de crédit pour les victoires plus importantes, cela signifie que leurs évaluations ont tendance à être gonflées au fil du temps.
Est-ce également un défaut des évaluations Elo du football ?
Possiblement. Vous pourriez vouloir reconsidérer ce que vous avez écrit sur l’Allemagne.
Alors, comment corriger cela ?
Ce n’est pas compliqué en principe. Il suffit de décompter davantage la marge de victoire lorsque les favoris gagnent et de l’augmenter lorsque les outsiders gagnent. La formule pour cela est la suivante :
Multiplicateur de marge de victoire = LN(ABS(PD)+1) * (2,2/((ELOW-ELOL)*.001+2,2))
Où PD est le différentiel de points dans le match, ELOW est la cote Elo de l’équipe gagnante avant le match, et ELOL est la cote Elo de l’équipe perdante avant le match.
C’est un peu moche, mais nous avons tous nos vices.
Je vois que vous avez des évaluations pour les équipes de cette année, mais elles n’ont encore joué aucun match ! Comment cela fonctionne-t-il ?
Je prends leur notation de la fin de la saison dernière et je l’actualise légèrement. Plus précisément, je la ramène à la moyenne d’un tiers. Rappelez-vous que la cote Elo moyenne est de 1500. Ainsi, si une équipe a terminé la saison dernière avec une cote de 1800, je la ramène à 1700 au début de la nouvelle saison. Au fait, toute cette notion de « saison » me paraît étrange. Nous n’en avons pas aux échecs.
Pour l’instant, les classements se résument à savoir quelles équipes étaient bonnes l’année dernière…
Techniquement parlant, un match affecte mes classements pour toujours une fois qu’il a été joué, juste avec un poids de plus en plus faible qui diminue progressivement jusqu’à presque rien avec le temps. Mais, oui, pour l’instant, mes notations portent surtout sur qui était bon la saison dernière. Les matchs vers la fin de la saison compteront davantage, notamment les matchs pendant les playoffs de l’année dernière.
Merci de prendre le temps ! Donc, vous dites que nous devrions prendre les Seahawks ?
Que diriez-vous d’une belle partie d’échecs ?
Voir les évaluations Elo de la semaine 1 et les cotes des séries éliminatoires.
Le meilleur de FiveThirtyEight, livré à vous.
.