close
oct. 18, 2017
oct. 18, 2017

Évaluer ses compétences de parieur : les méthodes bayésienne et fréquentiste

Comment évaluer son propre niveau de compétences en matière de paris ?

Quelle est la différence entre une approche bayésienne et une approche fréquentiste ?

Qu'est-ce qu'un degré d'aléa et quelles sont les probabilités de compétences attendues ?

Évaluer ses compétences de parieur : les méthodes bayésienne et fréquentiste

Au niveau le plus élémentaire, il faut réunir deux éléments pour pouvoir gagner de l'argent grâce aux paris : la technique et la chance. D'un côté, de nombreux parieurs n'accordent pas à cette dernière l'importance qui lui revient et, de l'autre, on oublie souvent de mesurer la première. Cet article explique pourquoi il est important de comprendre les différentes méthodes permettant d'évaluer ses compétences de parieur. Il montre également que les résultats obtenus dépendent de l'approche adoptée.

Les parieurs sportifs peuvent s'appuyer sur le théorème de Bayes pour améliorer leurs pronostics. On peut également l'utiliser pour évaluer sa propre capacité à formuler des prévisions correctes et à en tirer une espérance positive. J'ai déjà cherché à estimer la qualité d'un historique de paris suivant une approche fréquentiste (le test t). Cet article compare et confronte les deux méthodes.

Degrés de croyance

En théorie des probabilités, le théorème de Bayes décrit la probabilité conditionnelle d'un événement sachant un autre événement. Supposons par exemple que je pense avoir 50 % de chances d'être un bon parieur capable de faire des bénéfices. Si je gagne le pari suivant, quel en sera l'impact sur ma croyance vis-à-vis de cette proposition ? En d'autres termes, en quoi cette preuve de réussite modifiera-t-elle la probabilité que je sois doué pour les paris ? 

Le théorème de Bayes interprète la probabilité comme un « degré de croyance » à une proposition ou à une hypothèse, et formalise en termes mathématiques la relation entre le degré de croyance précédant la découverte de la preuve (la probabilité antérieure) et celui qui vient après sa prise en compte (la probabilité postérieure). Il s'exprime ainsi :

{équation} - P(A|B) = P(A) * P(B|A) / P(B)

Dans notre exemple :

P(A) = la probabilité antérieure que je sois bon en paris

P(B) = la probabilité antérieure que je gagne mon pari

P(B|A) = la probabilité que je gagne mon pari sachant que je suis un bon parieur

P(A|B) = la probabilité que je sois un bon parieur sachant que je gagne mon pari

Prenons un exemple. Supposons que, par définition, un bon parieur soit une personne capable d'obtenir invariablement un rendement de l'investissement égal à 110 %. Dans le cas de paris à un contre un, cela donnerait 55 gagnants sur 100. P(B|A), la probabilité que je gagne mon pari sachant que je suis compétent, s'élève donc à 55 %.

Pour un parieur lambda, la probabilité de remporter un pari équitable à un contre un, P(B), sera de 50 %. Imaginons cependant que j'aie la conviction a priori d'avoir une chance sur deux d'être doué (P(A) = 50 %) et que P(B) soit égal à 52,5 % (à mi-chemin entre 50 % et 55 %) pour un parieur de ce niveau.

Les meilleurs handicapeurs du milieu sont en général capables d'atteindre un taux de réussite d'environ 57 %. Une fois déduite la marge du bookmaker, ce ratio se traduit par une rentabilité de l'investissement approchant les 110 %.

Si je gagne mon pari, ces chiffres donnent une probabilité postérieure (P(A|B)) de 52,38 % selon le théorème de Bayes. Mon pari gagnant me conduit à croire que j'ai de meilleures chances qu'avant d'être compétent.

Le théorème de Bayes peut s'appliquer de manière itérative. Après avoir remporté mon premier pari et ajusté ma probabilité d'être un bon parieur, j'engage un autre pari. La probabilité postérieure calculée lors de la première étape devient la nouvelle probabilité antérieure.

La nouvelle probabilité postérieure que je sois doué dépend maintenant de la réussite (ou de l'échec) de mon nouveau pari. Si celui-ci est gagnant, elle augmente encore ; sinon, elle diminue. Dans cet exemple, si je remporte mon deuxième pari, mes chances d'être compétent passent à 54,75 %. 

Ce processus peut se répéter à l'infini, chaque nouvelle probabilité conditionnelle se trouvant quelque part entre 0 % et 100 %. J'ai effectué 1 000 itérations, soit 1 000 paris ; le tableau ci-dessous indique l'historique de paris obtenu (la ligne bleue), ainsi que les probabilités bayésiennes que je sois un bon parieur après chaque pari (la ligne rouge).

Assessing skill in gambling

L'interprétation bayésienne des probabilités pose un problème majeur : elle exige de solides connaissances ou croyances préalables par rapport à un événement ou à une situation. Mais dispose-t-on vraiment de ces informations pour évaluer mes chances d'être un bon parieur ? Mon choix de 50 % dans cet exemple était purement arbitraire et fondé sur de simples suppositions. Regardons ce qu'il se passe si je fixe maintenant la probabilité antérieure initiale à 1 %. 

Assessing skill in gambling

Par ailleurs, la signification des mots « compétent », « doué » et « bon » dans ce contexte est totalement arbitraire. On pourrait soutenir qu'un parieur capable d'obtenir 105 % de rentabilité du capital investi est particulièrement doué s'il parvient à la maintenir sur plus de 10 000 paris. Lisez cet article sur la loi des petits nombres pour découvrir en quoi la taille de l'échantillon a son importance. La définition de P(B) à chaque itération, sachant la valeur actualisée de P(A), n'est pas claire non plus. 

Dans mon modèle bayésien, j'ai simplement supposé une relation linéaire, selon laquelle, si P(A) = 0 % / 20 % / 40 % / 60 % / 80 % / 100 %, alors P(B) = 50 % / 51 % / 52 % / 53 % / 54 % / 55 %, mais sa validité est assurément discutable. De plus, et c'est peut-être plus important encore, dans la mesure où quelqu'un qui affiche une probabilité de victoire de référence de 52,5 % est clairement un bon parieur à part entière (simplement, pas aussi doué que celui qui atteint 55 %), ce que nous mesurons ici sur la compétence relève en réalité plus du degré que de la probabilité. 

Cependant, cette représentation graphique de l'évolution de la probabilité bayésienne offre quand même une estimation intuitive de la propension (ou de la capacité) d'un parieur à dégager des bénéfices réguliers, et de sa progression au fil du temps.

Les degrés d'aléa

Contrairement à l'approche bayésienne qui se concentre sur la probabilité d'une hypothèse (je suis un bon parieur) étant donné un ensemble fixe de données (les profits et les pertes), la démarche fréquentiste s'attache à la probabilité (ou à la fréquence) des données compte tenu de l'hypothèse. Cette fois, c'est l'hypothèse qui est fixe : il est soit vrai (probabilité de 100 %) soit faux (probabilité de 0 %) que je suis compétent. Les données, elles, sont supposées aléatoires. 

À partir d'une croyance antérieure selon laquelle le parieur a une probabilité de 1 % d'être compétent, on aboutit à seulement 20 % après 1 000 paris.

En général, l'approche fréquentiste part de l'hypothèse nulle, à savoir ici que je ne suis pas compétent et que les résultats de mes paris sont tous le fruit du hasard. Elle tente alors de calculer, grâce aux statistiques, la probabilité (traditionnellement nommée valeur p) que les données observées, dans ce cas mon historique de profits et de pertes, se soient produites à supposer que l'hypothèse nulle soit vraie.

Enfin, cette probabilité est comparée à un seuil de signification acceptable (parfois noté α) tel que, si p < α (en général, 1 % ou 5 %), l'hypothèse nulle est rejetée en faveur de l'hypothèse valide.

La statistique que j'ai examinée dernièrement dans les Ressources sur les paris de Pinnacle est le score t, dont le nom provient du test d'hypothèse statistique de Student. Si l'on suppose que les cotes des paris sont équitables, on peut estimer le score t de la façon suivante :

où n = le nombre de paris, r = le rendement de l'investissement (sous forme décimale) et o = les cotes moyennes (sous forme décimale). Pour convertir le score t en une valeur p, on utilise des tableaux statistiques et un calculateur en ligne. Sous Excel, il existe pour cela la fonction TDIST. Regardons ce que l'on obtient avec notre exemple d'historique de paris.

Le graphique ci-dessous compare l'évolution d'origine des probabilités bayésiennes (que je sois compétent, à partir de la croyance antérieure initiale selon laquelle il y a 50 % de chances que ce soit le cas), en rouge, avec l'évolution de la valeur p fréquentiste (la probabilité que les résultats obtenus soient le fruit du hasard à supposer que je n'aie aucune compétence), en vert, suivant un test t bilatéral sur un seul échantillon.

Assessing skill in gambling

D'un point de vue généralement qualitatif, les deux lignes sont symétriques l'une par rapport à l'autre, même si c'est probablement plus dû au hasard qu'autre chose. Il ne faut pas pour autant retenir l'idée selon laquelle la valeur p mesurerait les chances de ne pas être compétent, et que 1 - p correspondrait par conséquent à la probabilité de l'être.

À tout le moins, l'analyse bayésienne comme l'analyse fréquentiste doivent aussi servir de rappel au parieur, afin qu'il se souvienne que gagner sa vie grâce aux paris est un travail de longue haleine.

Une probabilité de 5 % que notre historique de profits et de pertes soit le fruit du hasard n'est pas équivalente à 95 % de chances qu'il soit imputable à nos compétences. Cela signifie simplement que, si l'on suppose que l'hypothèse nulle (les gains et les pertes des paris sont purement aléatoires) est vraie, ce que l'on a observé devrait se produire dans 5 % des cas.

Le point faible de l'approche fréquentiste est qu'elle traite la vérité comme un absolu. L'approche bayésienne, en revanche, la considère implicitement comme probabiliste, provisoire et toujours falsifiable. Malgré ce défaut, le test d'hypothèse fréquentiste n'en représente pas moins un outil tout aussi pratique, qui permet d'analyser un historique de paris et de vérifier s'il est probable ou non qu'il se soit produit pour des raisons autres que le hasard.

Qu'obtient-on avec un modèle bayésien, si la croyance antérieure initiale correspond à une probabilité de seulement 1 % (et non plus 50 %) que je sois compétent ? Comparons les résultats avec ceux du modèle fréquentiste.

Assessing skill in gambling

Cette fois, il est clair que notre test t nous portera à croire bien plus franchement à notre capacité à faire de bons pronostics que l'approche bayésienne, qui elle est bien plus modeste.

Cela met une fois de plus en évidence la sensibilité de la probabilité bayésienne à la croyance antérieure initiale. Dans ce cas, après presque 700 paris, alors que notre test t nous dirait peut-être que notre historique de paris a seulement une probabilité de 3 % de se produire par hasard, le théorème de Bayes impliquerait qu'il reste encore moins de 10 % de chances que je sois suffisamment doué pour obtenir un rendement de 110 % sur le long terme.

Ma préférence, en parieur prudent que je suis, va vers la croyance antérieure la plus humble en ce qui concerne mes capacités : sauf si j'ai de bonnes raisons d'en douter, je commence toujours par supposer que je n'ai que peu ou pas de compétences.

Probabilités de compétences attendues

L'analyse ci-dessus présente un seul exemple aléatoire de série de paris avec une rentabilité présumée de 110 %. Par souci de clarté visuelle, j'ai délibérément choisi un historique de paris qui me permettait d'exposer les idées évoquées.

Pour rentrer un peu plus dans les détails de l'espérance, c'est-à-dire pour savoir à quoi s'attendre en moyenne, il faut cependant appliquer le modèle un grand nombre de fois. Ceux qui connaissent bien les Ressources sur les paris de Pinnacle savent que l'on peut pour cela utiliser une simulation de Monte-Carlo.

Le premier graphique ci-dessous montre les résultats, pour 10 taux de réussite présumés, de 10 000 itérations de simulations de Monte-Carlo sur l'évolution de la probabilité bayésienne que je sois un bon parieur : de 51 % à 60 % avec un intervalle de 1 % (ce qui équivaut à une espérance située entre 102 % et 120 % avec un intervalle de 2 %, si l'on suppose que les cotes sont équitables).

Les courbes ont été dessinées en calculant la valeur médiane de la probabilité bayésienne après chacun des 1 000 paris séquentiels de l'historique, ce qui offre dans notre cas une meilleure représentation que la moyenne (où les valeurs faibles et les valeurs élevées risquent de fausser l'interprétation). 

On suppose que la croyance antérieure initiale concernant mes compétences (p(A)) s'élève à 1 %. Sans surprise, plus le taux de réussite hypothétique (et l'espérance) croît, plus ma confiance en mes capacités s'approche vite de la probabilité de 100 %. (Plus la courbe est foncée, plus le taux de réussite présumé est élevé.)

Assessing skill in gambling

Les meilleurs handicapeurs du milieu sont en général capables d'atteindre un taux de réussite d'environ 57 %. Une fois déduite la marge du bookmaker, ce ratio se traduit par une rentabilité de l'investissement approchant les 110 %. Ce graphique montre que, si vous avez l'ambition d'en devenir un vous-même, il vous faudra attendre presque 1 000 paris pour acquérir une confiance solide et significative en vos capacités, à supposer bien sûr que vous vous considériez comme peu compétent au démarrage. 

En revanche, si vous obtenez un taux de réussite de 54 %, moins élevé mais toujours rentable, vous n'aurez vraiment foi en ce que vous faites que bien plus tard. À partir d'une croyance antérieure selon laquelle le parieur a une probabilité de 1 % d'être compétent, on aboutit à seulement 20 % après 1 000 paris. 

Le graphique final illustre un ensemble similaire de valeurs p attendues idéalisées à partir du même historique de 1 000 paris et des mêmes taux de réussite hypothétiques. Nous avons une équation qui nous donne une approximation du score t pour toutes les combinaisons possibles entre les volumes de paris, les rendements et les cotes ; il n'est donc pas nécessaire d'appliquer une simulation de Monte-Carlo. Là encore, plus la couleur de la courbe est foncée, plus le taux de réussite présumé est élevé (de 51 % à 60 %).

Assessing skill in gambling

Avec un taux de réussite de 57 %, le premier seuil de signification statistique (valeur p < 5 %) est atteint après seulement 200 paris, et le deuxième (valeur p < 1 %) après environ 335 paris. Cependant, cette confirmation ne nous dit rien de notre niveau en matière de paris ; elle met simplement en évidence la probabilité que cet historique soit le fruit du hasard, en supposant une absence totale de compétences. 

Par ailleurs, ces seuils de signification statistique, de même que les probabilités antérieures bayésiennes dont nous sommes partis, s'appuient presque exclusivement sur des jugements subjectifs. Mais, tout comme le modèle bayésien, le test d'hypothèse statistique de la valeur p représente pour le parieur un moyen utile d'évaluer sa capacité à trouver systématiquement une espérance rentable, à condition de garder ces mises en garde à l'esprit.

À tout le moins, l'analyse bayésienne comme l'analyse fréquentiste doivent aussi servir de rappel au parieur, afin qu'il se souvienne que gagner sa vie grâce aux paris est un travail de longue haleine. Ne partez jamais du principe que quelques victoires impliquent que vous savez ce que vous faites.

Ressources sur les paris - Vous aider à mieux parier

Les Ressources sur les paris de Pinnacle constituent la bibliothèque en ligne la plus complète de conseils d'experts sur les paris. Notre objectif est tout simplement de permettre aux parieurs d'acquérir davantage de connaissances, quel que soit leur niveau d'expérience.