L'un de mes tout premiers articles sur Pinnacle, il y a bientôt trois ans, s'intéressait au caractère aléatoire des paris. J'aimerais, dans cet article, revenir sur ce sujet.
Les paris sont, de toute évidence, une affaire de résultats, mais ce sont les probabilités qui déterminent les profits réalisés et les pertes subies. Les cotes d'un bookmaker sont le reflet de ces probabilités : elles représentent les chances qu'un événement se produise. Les parieurs tentent de déterminer des probabilités plus justes afin de gagner en valeur attendue.
Toutefois, et ainsi que nous l'a rappelé le directeur commercial de Pinnacle, Marco Blume, lors d'une récente émission consacrée aux paris diffusée par Pinnacle, tout ce que vous savez, c'est si vous avez gagné ou perdu. Impossible pour vous d'être certain que vous avez été plus ou moins précis dans votre évaluation de ces probabilités, en tout cas pour des paris en particulier.
Les sources d'incertitude
On peut mettre en évidence deux sources d'incertitude à l'endroit des paris. Premièrement, votre modèle de prévisions de la probabilité réelle d'un résultat peut s'avérer valable, mais ce résultat est binaire. Si vous êtes chanceux, il gagne, si vous êtes malchanceux, il perd.
Le mathématicien français Pierre-Simon Laplace avait pour théorie que le hasard et la chance ne sont que le reflet d'un manque d'informations sur le sujet auquel ils s'appliquent. Dans cette optique, le caractère aléatoire d'une chose ne serait qu'illusion. Selon lui, si une personne connaissait « toutes les forces dont la nature est animée et la situation respective des êtres qui la composent », alors « rien ne serait incertain pour elle » et les probabilités des paris seraient réduite à des 0 et à des 1. Intuitivement, une telle affirmation semble logique.
Si vous gagnez ou perdez plus que ce qui vous semble normal, vous vous êtes peut-être montré chanceux ou malchanceux, ou bien votre modèle n'est pas valable, ou les deux.
Cette approche constitue d'ailleurs le fondement de la méthode de score de Brier, qui vise à évaluer la précision d'une prévision. En pratique, toutefois, la nature complexe d'un système comme celui d'un événement sportif rendrait impossible une analyse de donnée permettant de réaliser le rêve de Laplace. La théorie du chaos nous enseigne que des variations mineures au départ ont pour résultat de grandes différences à l'arrivée. Il serait impossible de rassembler assez d'informations pour atteindre la certitude.
Les lois de la micro-physique (à l'échelle atomique et subatomique), quant à elles, rendent cette impossibilité non-seulement pratique, mais aussi fondamentale. Le principe d'indétermination de Heisenberg nous apprend qu'il est impossible de connaître avec une totale exactitude à la fois la position de quelque chose et sa quantité de mouvement. Ce n'est pas par manque d'information, mais en raison de la nature fondamentale de la réalité.
Si la connaissance parfaite de l'état d'une chose nous échappe dans le présent, comment serait-il possible de prédire ce qu'elle va devenir dans le futur ? On pourra toujours avancer que le monde subatomique n'a pas grand-chose de commun avec celui des paris. Toutefois, le monde que nous connaissons en est issu, et pour cette raison, nous nous devons de lui accorder une certaine importance. C'est ainsi que procèdent déjà certains scientifiques.
Ces limites, tant pratiques que théoriques, nous amènent à accepter que la bonne ou la mauvaise chance dues au caractère aléatoire du système analysé sont inhérentes à celui-ci, et que le concept de probabilité « réelle » non-binaire peut s'avérer utile.
La seconde source d'incertitude est la validité de votre modèle de prédiction lui-même. Comment pouvez-vous être certain que votre évaluation des probabilités d'un résultat était juste ? Ainsi que l'a suggéré Marco, on ne peut répondre à cette question en se fondant sur les résultats de paris en particulier.
Gagner un pari coté à 2,00 est toujours satisfaisant, mais ce succès ne vous dira pas si l'événement avait bien 55 % de chances de se réaliser, ainsi que ce chiffre le laissait croire. Et si en réalisant des milliers de paris similaires, vous ne gagniez que 45 % d'entre eux ? Vous pourriez en conclure que les probabilités que vous aviez prédites étaient invalides. Et si vous remportiez 65 % de ces paris ? Vous gagneriez gros, mais le modèle ne serait-il pas tout de même invalide ?
Ces deux sources d'incertitude sont, dans une certaine mesure, indiscernables. Si vous gagnez ou perdez plus que ce qui vous semble normal, vous vous êtes peut-être montré chanceux ou malchanceux, ou bien votre modèle n'est pas valable, ou les deux. Dans la suite de cet article, je veux m'interroger sur ce à quoi ces notions renvoient notre perception de notre propre historique de paris.
Une véritable modèle de paris
Les lecteurs qui me suivent sur Twitter connaissent probablement le système de paris que j'ai nommé « sagesse populaire ». Ce n'est pas un système sophistiqué permettant des prévisions complexes. Il s'agit plus simplement de considérer qu'en matière de précision des cotes, Pinnacle est mieux renseigné que nous. En retirant la marge du site, on obtient des cotes qui peuvent être considérées comme « réelles », et qui reflètent les probabilités « réelles » du résultat d'un match de football.
L'idée d'un modèle de paris, même valable, se conformant parfaitement aux attentes à chaque fois, ou même parfois, doit être définitivement oubliée.
Dans mes deux derniers articles, j'ai démontré que Pinnacle pouvait se tromper, c'est-à-dire publier des cotes ne faisant pas forcément preuve d'une efficacité parfaite. Sur un échantillon moyen de cotes, cependant, tout semble indiquer que cette efficacité est atteinte. Si nous connaissons les cotes « réelles », alors il ne reste plus qu'à trouver des cotes plus importantes ailleurs. Si le modèle est valable sur le long terme, un profit équivalent à l'avantage trouvé devrait se dégager. Voyons ce que disent les chiffres.
Depuis que j'ai commencé à suggérer des paris avantageux, en août 2015, 7 432 ont été publiés, avec une cote moyenne de 3,91 (minimum 1,11, maximum 67,00, médiane 2,99) et une valeur moyenne attendue de 4,17 % (soit un retour sur investissement prévu de 104,17 %).
L'historique des profits ci-dessous permet de comparer les performances réelles aux attentes, en se basant sur une stratégie de mise par niveau d'une unité par pari.
L'évolution réelle des profits nous confirme, si besoin en était, que la loi des plus petits nombres peut être terriblement trompeuse, même si ces « petits » nombres nous paraissent grands. À plusieurs reprises, on aurait pu être tenté de jeter l'éponge. En effet, la plus longue période de drawdown est longue de plus de 2 000 paris. Toutefois, malgré les hauts et les bas observables à diverses échelles, la performance globale est assez proche de celle espérée. Le retour sur investissement s'élève, au final, à 103,80 %.
Un tel résultat semble impliquer que le modèle est, en moyenne, valable. À court terme, cependant, il est impossible de s'assurer que notre modèle fonctionne correctement. Toutefois, comme nous l'avons vu précédemment, il est impossible de considérer séparément le caractère aléatoire de la bonne et de la mauvaise chance, et celui des sur-performances ou des sous-performances de notre modèle de prévision. Mais regardons de plus près la différence qui existe entre nos prévisions et notre performance réelle.
Pinnacle pratique une politique de bienvenue aux gagnants
Pariez avec un bookmaker qui vous laisse gagner
S'inscrireSe connecterMesurer les écarts entre la réalité et les attentes
La façon la plus simple de mesurer l'écart de prévision (c'est-à-dire celui qui sépare la ligne bleue de la rouge à n'importe quel endroit de l'historique de paris) est de calculer la différence entre les profits attendus et les profits réels.
Prise individuellement, pour chaque pari, cette information n'est cependant pas très utile, dans la mesure où nous les savons gagnants (profits = cote - 1) ou perdants (profits = -1). Les variations seraient bien trop importantes pour en tirer la moindre conclusion. Sur de plus larges échantillons, toutefois, on peut discerner des motifs. Voici l'écart de prévision pour une moyenne mobile de 100 paris.
L'ensemble est plutôt chaotique, et présente de multiples résultats supérieurs ou inférieurs aux attentes de plus ou moins 20 % sur une série de 100 paris, et même, à une occasion, de plus de 70 %.
Redisons-le : il est impossible de savoir à quel point cette variance est due à l'imperfection de notre modèle sur cette période de temps, et à quel point elle résulte de notre bonne ou de notre mauvaise chance. Ce qui est certain, c'est que cette déviation est importante, et qu'elle n'est pas totalement imputable au hasard.
Comment se passent les choses sur une période de temps plus longue ? Voici le même graphique, pour une moyenne mobile de 1 000 paris.
Sans surprise, on constate que la variance est plus faible et que les différences, bien que toujours importantes, sont d'une amplitude plus limitée ; les périodes de sur-performance et de sous-performance s'étendent sur des séries de plusieurs milliers de paris. La sur-performance maximum sur plus de 1 000 paris est de 15 %, tandis que l'équivalent en sous-performance est de -11 %.
Quelles sont les chances que de tels écarts se produisent ? En tirant à pile ou face 100 fois d'affilée, on s'attend à tomber 50 fois sur chaque côté de la pièce ; c'est le résultat le plus probable. Il est facile de déterminer la probabilité de faire 40 fois face et 60 fois pile, et vice versa. Nous pouvons faire de même pour notre historique de paris.
Afin de calculer la probabilité de tout écart par rapport aux prévisions, j'ai utilisé approximation de test de Student, mais j'aurais aussi bien pu me servir d'une simulation de Monte-Carlo. Les deux méthodes m'ont donné des résultats équivalents. Pour commencer, voyons la période de la moyenne mobile de 100 paris. Les probabilités sont représentées sous la forme « une chance sur x », et l'échelle est logarithmique.
Encore une fois, les écarts sont importants, et, parfois, assez improbables. À plusieurs occasions, un échantillon de 100 paris présente un écart tel qu'il ne devrait s'en produire qu'une fois sur cent. L'un des échantillons présente en effet un écart d'un sur cinq mille, et pourtant, son occurrence est probablement due au hasard.
Voici le même graphique, pour une moyenne mobile de 1 000 paris.
L'idée d'un modèle de paris, même valable, se conformant parfaitement aux attentes à chaque fois, ou même parfois, doit être définitivement oubliée. Souvent, il s'en éloigne, et parfois même de manière considérable.
Bien sûr, les parieurs efficaces savent que la moyenne de leurs résultats à long terme est la seule donnée importante. Ils traverseront des périodes soumises au caractère aléatoire de leur pratique, soit en raison de leur bonne ou mauvaise chance, soit en raison de l'imperfection de leur modèle sur des périodes de temps plus courtes. J'espère avoir de nouveau réussi à montrer, comme dans mon premier article sur le hasard, que ces périodes de temps ne s'appliquent pas qu'à des séries de dizaines ou de centaines de paris, mais également de plusieurs milliers.