close
janv. 14, 2016
janv. 14, 2016

Régression vers la moyenne dans le domaine des paris sportifs

Régression vers la moyenne dans le domaine des paris sportifs
Les systèmes prévisionnels étant essentiellement fondés sur les performances antérieures, la compréhension de la régression vers la moyenne est cruciale pour les parieurs sportifs. La saison 2015-16 de Premier League ne manque pas de surprises jusqu'ici et une question se pose : les résultats extrêmes sont-ils durables ? Voici une analyse du point de vue statistique.

Dans le cadre de systèmes aléatoires ou essentiellement aléatoires, les variables les plus extrêmes lors d'une mesure initiale ont tendance à être moins extrêmes lors d'une seconde mesure. Ce phénomène est appelé régression vers la moyenne.

Par exemple, les performances de Leicester durant la première partie de la saison 2015/16 de Premier League pourraient lui valoir un meilleur classement d'équipe que Chelsea, dont les performances ont été bien en deçà des attentes sur la même période. Mais si la majorité des facteurs ayant contribué à leur cote d'équipe respective relevaient du hasard, le phénomène de régression vers la moyenne impliquerait que ces classements risquent de ne pas perdurer.

Mesure des performances d'équipe

Un moyen de mesurer les performances d'une équipe consiste à les comparer aux attentes du marché. Par exemple, si la cote de la victoire d'une équipe est de 2.00, cela signifie que le marché estime qu'elle a 50 % de chances de l'emporter (sans tenir compte de l'influence de la marge du bookmaker). Si elle gagne, elle surperforme par rapport aux attentes du marché ; si elle n'arrive pas à l'emporter, elle sous-performe.

Dans le cadre de systèmes aléatoires, les variables les plus extrêmes lors d'une mesure initiale ont tendance à être moins extrêmes lors d'une seconde mesure.

Cette approche est qualitativement équivalente à la méthode du score de Brier, qui mesure le degré de déviation d'une équipe par rapport à la signification des cotes. La principale différence réside dans le fait qu'elle nous permet de mesurer la direction et l'ampleur de cette déviation par rapport aux attentes.

Analysons les performances de Leicester et de Chelsea par rapport aux attentes de Pinnacle au cours des 20 premiers matches de la saison 2015/16 de Premier League. Pour chaque victoire, une équipe se voit attribuer un score de risque ajusté égal à [1 – 1/cote], tandis que pour chaque match non gagné, elle se voit attribuer un score de [-1/cote].

Au fil de la saison, ces scores s'additionnent cumulativement. Les tableaux ci-dessous révèlent que les performances de Leicester ont largement dépassé les attentes du marché des paris de Pinnacle Sports, alors que celles de Chelsea ont été bien en dessous.

20 premiers matches de Chelsea

Adversaire Date Cote Pinnacle Résultat Gain/perte Gain/perte cumulé
Swansea 08/08/15 1.39 Absence de victoire -0.72 -0.72
Manchester City 16/08/15 3.87 Absence de victoire -0.26 -0.98
West Bromwich Albion 23/08/15 1.65 Victoire 0.39 -0.58
Crystal Palace 29/08/15 1.37 Absence de victoire -0.73 -1.31
Everton 12/09/15 2.01 Absence de victoire -0.50 -1.81
Arsenal 19/09/15 2.45 Victoire 0.59 -1.22
Newcastle 26/09/15 1.63 Absence de victoire -0.61 -1.83
Southampton 03/10/15 1.83 Absence de victoire -0.55 -2.38
Aston Villa 17/10/15 1.34 Victoire 0.25 -2.13
West Ham 24/10/15 2.01 Absence de victoire -0.50 -2.62
Liverpool 31/10/15 2.07 Absence de victoire -0.48 -3.11
Stoke 07/11/15 2.07 Absence de victoire -0.48 -3.59
Norwich 21/11/15 1.43 Victoire 0.30 -3.29
Tottenham 29/11/15 2.89 Absence de victoire -0.35 -3.63
Bournemouth 05/12/15 1.38 Absence de victoire -0.72 -4.36
Leicester 14/12/15 2.38 Absence de victoire -0.42 -4.78
Sunderland 19/12/15 1.32 Victoire 0.24 -4.54
Watford 26/12/15 1.52 Absence de victoire -0.66 -5.19
Manchester United 28/12/15 2.95 Absence de victoire -0.34 -5.53
Crystal Palace 03/01/16 2.07 Victoire 0.52 -5.02

20 premiers matches de Leicester

Adversaire Date Cote Pinnacle Résultat Gain/perte Bénéfice/perte cumulé
Sunderland 08/08/15 1.99 Victoire 0.50 0.50
West Ham 15/08/15 3.42 Victoire 0.71 1.21
Tottenham 22/08/15 2.69 Absence de victoire -0.37 0.83
Bournemouth 29/08/15 3.57 Absence de victoire -0.28 0.55
Aston Villa 13/09/15 1.86 Victoire 0.46 1.02
Stoke 19/09/15 3.10 Absence de victoire -0.32 0.69
Arsenal 26/09/15 4.55 Absence de victoire -0.22 0.47
Norwich 03/10/15 3.31 Victoire 0.70 1.17
Southampton 17/10/15 5.10 Absence de victoire -0.20 0.98
Crystal Palace 24/10/15 2.21 Victoire 0.55 1.52
West Bromwich Albion 31/10/15 2.70 Victoire 0.63 2.15
Watford 07/11/15 1.88 Victoire 0.47 2.62
Newcastle 21/11/15 2.58 Victoire 0.61 3.23
Manchester United 28/11/15 3.26 Absence de victoire -0.31 2.93
Swansea 05/12/15 2.80 Victoire 0.64 3.57
Chelsea 14/12/15 3.11 Victoire 0.68 4.25
Everton 19/12/15 3.65 Victoire 0.73 4.97
Liverpool 26/12/15 4.00 Absence de victoire -0.25 4.72
Manchester City 29/12/15 4.25 Absence de victoire -0.24 4.49
Bournemouth 02/01/16 1.94 Absence de victoire -0.52 3.97

À quel point les performances reposent-elles sur le hasard ?

Désormais, une question se pose : doit-on s'attendre à ce que la surperformance de Leicester et la sous-performance de Chelsea par rapport aux attentes du marché se poursuivent ? Si ces tendances résultaient essentiellement de facteurs de causalité comme le talent des joueurs et le style de direction sportive, nous pourrions nous attendre à une faible régression vers les attentes du marché, du moins jusqu'à ce que le marché ait complètement réévalué le niveau de talent de chacune de ces équipes. À l'inverse, si elles relevaient essentiellement du hasard, la régression vers la moyenne devrait être plus rapide et complète.

Afin de déterminer l'influence de la régression vers la moyenne (et par conséquent du hasard) sur le résultat des matches de football, nous avons ventilé nos données en deux moitiés (les phases aller et retour d'une saison) avant de les comparer. En cas de faible régression vers la moyenne, nous pourrions nous attendre à ce que des performances extrêmes lors de la phase aller soient tout simplement associées à des performances tout aussi extrêmes lors de la phase retour.

Autrement dit, les performances perdureraient. À l'inverse, en cas de régression significative vers la moyenne, des performances extrêmes lors de la phase aller devraient afficher une faible corrélation avec des performances extrêmes lors de la phase retour.

Le graphique ci-dessous illustre cette corrélation pour les équipes de football de la Premier League et de la Football League anglaises sur les saisons 2012/13 à 2014/15. Chacun des 276 points de données représente une paire de résultats aller/retour pour chaque équipe au cours d'une même saison. La ligne sombre représente la tendance moyenne de ces points de données. 

Corrélation entre les performances aller et retour

regression-to-mean-betting-table.jpg

Comme vous pouvez le constater, la corrélation est quasiment inexistante et la régression vers la moyenne est quasiment parfaite. La valeur du carré du coefficient de corrélation linéaire, ou R2, dans un tel diagramme de corrélation définit le degré de contribution de la variabilité d'une variable à la variabilité de la seconde variable.

Une valeur égale à 1 est synonyme de parfaite corrélation, tandis qu'une valeur nulle indique une absence de corrélation. Ici, nous pouvons constater que la variabilité des performances sur la première moitié de saison ne contribue quasiment pas à la variabilité des performances sur la seconde moitié de saison. Autrement dit, il n'existe aucun lien de causalité entre les deux et l'écart par rapport aux attentes du marché est essentiellement une question de hasard.

Les 20 équipes ayant le plus haut degré de sous-performance affichaient une performance moyenne de -4.05 au cours de la première moitié de saison. Leurs performances sur la seconde moitié ont régressé vers une moyenne de -0.01, une seule équipe affichant une performance plus mauvaise. Inversement, les 20 équipes les plus surperformantes de la phase aller affichaient une performance moyenne de +3.71, qui a régressé vers +0.13 lors de la phase retour. Encore une fois, seule une équipe a affiché une performance plus extrême lors de la phase retour que lors de la phase aller.

Il est possible que l'évaluation des performances d'équipe sur l'ensemble d'une saison porte sur une période trop longue. De nombreux événements peuvent se produire en l'espace de 38 matches (ou 46 dans le cas de la Football League) et s'attendre à la moindre persistance significative des performances entre les phases aller et retour d'une saison revient au mieux à prendre ses désirs pour des réalités.

En outre, on peut supposer que si le niveau de talent d'une équipe avait radicalement changé, le marché des paris commencerait à refléter ce changement dans les cotes avant la seconde moitié de la saison, garantissant ainsi que tout écart futur par rapport aux attentes soit de toutes façons moins extrême que précédemment, indépendamment de tout processus aléatoire. 

Il serait peut-être possible de réduire cette influence en étudiant une période bien plus courte, par exemple de 12 matches. En effet, de nombreux systèmes prévisionnels quantitatifs se fondent sur des périodes de cet ordre afin de fournir des indicateurs de performance pour les futurs matches.

Malheureusement, la corrélation entre les performances au cours des 6 premiers matches et celles sur les 6 matches suivants est tout aussi faible. Sur un total de 1 596 paires de corrélations possibles, la valeur du R2 était à nouveau nulle sur deux chiffres significatifs. Même sur une période limitée à 12 matches, il semblerait que les performances d'une équipe de football par rapport aux attentes du marché soient quasiment entièrement une question de hasard.

Sagesse du marché des paris

Si nous réfléchissons à ce qu'un marché de paris comme celui offert par Pinnacle représente vraiment, les raisons pour lesquelles le hasard est un facteur d'une telle importance dans les résultats de paris de football deviendront évidentes. Nous ne sommes pas en train de dire que le résultat d'un match se résume à une question de hasard. Des équipes comme Arsenal, Manchester City ou Chelsea (le plus souvent) sont clairement meilleures que des équipes comme Norwich, Sunderland ou Bournemouth, et leur talent supérieur augmente leur probabilité de victoire future. 

Nous disons plutôt que le marché des paris, grâce à l'ajustement des cotes de paris, prend en compte ce différentiel en matière de talent collectif. Les équipes perçues comme ayant une plus forte probabilité de victoire susciteront généralement un intérêt plus fort de la part des parieurs et leur cote sera donc plus faible. La cote joue ainsi le rôle d'une sorte de handicap compensant la différence de talent entre les équipes. En raison de ce processus de handicap, les résultats deviennent davantage une question de hasard.

Lorsqu'une foule de parieurs exprime, à travers ses paris, son opinion sur le résultat probable d'un match, elle arrive souvent à une évaluation relativement précise de la probabilité de ce résultat par le biais d'un processus semblable à celui d'équilibre du marché (où la demande des parieurs est compensée par l'offre des bookmakers). Ce phénomène est fort logiquement connu sous le nom de sagesse de la foule.

Pinnacle est renommée pour certains des marchés de paris les plus avisés et les plus efficaces, ce qui constitue l'une des raisons pour lesquelles l'entreprise est capable d'offrir les meilleurs prix avec les marges les plus faibles. Cependant, un marché de paris n'est pas entièrement efficace en permanence, ce qui est particulièrement vrai dans la période suivant immédiatement son ouverture, lorsque relativement peu de parieurs ont exprimé leur opinion et que des erreurs de tarification peuvent survenir. 

Les parieurs les plus malins tendent à effectuer leurs paris au cours de cette période à des cotes fréquemment meilleures qu'à l'approche de la clôture. Néanmoins, même les résultats de ces parieurs peuvent encore être dominés par le hasard à court terme. La connaissance du phénomène de régression vers la moyenne doit aider les parieurs à mieux comprendre les influences du hasard et du talent.

Prêt à parier sur la Premier League anglaise (EPL) ? Pinnacle offre une gamme étendue de cotes EPL à faible marge disponibles sur une multitude de marchés différents. Ouvrez un compte ici ou, si vous êtes toujours en phase de découverte de l'univers des paris sportifs, jetez un œil à notre page d'articles dédiés aux paris qui vous aidera à vous lancer immédiatement.

strategy-openaccount.jpg 

Ressources sur les paris - Vous aider à mieux parier

Les Ressources sur les paris de Pinnacle constituent la bibliothèque en ligne la plus complète de conseils d'experts sur les paris. Notre objectif est tout simplement de permettre aux parieurs d'acquérir davantage de connaissances, quel que soit leur niveau d'expérience.