Pinnacle

La loi de Poisson est un concept mathématique qui transpose des moyennes en une probabilité de résultats variables au sein d'une distribution. Par exemple, si nous savons que Manchester City marque 1,7&nbsp;but par match en moyenne. Si l'on applique la formule de Poisson, on constate que cette moyenne correspond au résultat suivant&nbsp;: Manchester City marque 0&nbsp;but 18,3&nbsp;% du temps, 1&nbsp;but 31&nbsp;% du temps, 2&nbsp;buts 26,4&nbsp;% du temps et 3&nbsp;buts 15&nbsp;% du temps.

La loi de Poisson, associée aux données historiques, fournit une méthode simple et fiable pour calculer le score le plus probable d'un match de football qui peut être appliquée aux paris. Cette procédure pas à pas vous montre comment calculer les mesures de force d'attaque/potentiel de défense nécessaires et vous présente un raccourci pratique pour générer les valeurs de la loi de Poisson. En un rien de temps, vous pourrez prédire les scores des matchs de football à l'aide de la loi de Poisson.

Loi de Poisson : prédire le score dans le cadre d'un pari au football

En découvrant un marché de niche dans les paris, vous pourrez souvent trouver de la valeur. Il peut aussi bien s'agir d'une expertise des paris sur le handball que d'une connaissance approfondie des paris sur le baseball japonais. Là où le parieur en sait plus que le bookmaker, il y a de l'argent à gagner.  &lt;Pariez sur le football sur Pinnacle Casino&gt; Ils constituent

De manière inexplicable, les corners sont parmi les actions les plus excitantes dans le football. Seuls environ trois pour cent d'entre eux débouchent sur un but, mais vous pouvez être sûr que les supporters de l'équipe attaquante vont manifester leur joie et leurs encouragements si leur équipe en obtient un. Lisez la suite pour savoir comment profiter des paris sur les corners.

Les paris sur les corners au football : un marché méconnu mais intéressant

Lisez ou écoutez Premier League Insights  Podcast Pinnacle · EPL Insights 2023/24 Le podcast Pinnacle Premier League Insights, disponible sur Apple Podcasts et YouTube,

En savoir plus

Consultez les dernières cotes sur la Premier League

Consultez nos articles pour étayer vos pronostics sur la Premier League avant les prochains matchs grâce aux cotes, aux informations et aux analyses de Pinnacle.

Pronostics pour la Premier League

Comprendre tous les types de paris disponibles est essentiel pour accroître la rentabilité des paris au tennis, car vous pouvez choisir l'option idéale pour la manière dont vous aimez parier. Le type de pari basique au tennis est le pari portant sur le vainqueur du match. Dans ce cas, vous pariez sur le joueur de tennis qui va battre son adversaire et passer à l'étape suivante. Prenons par exemple le match de

Alors que l'Open d'Australie est sur le point de commencer, c'est le moment de comprendre certains des types de paris les plus communs au tennis, et quels paris offrent la meilleure possibilité d'empocher un profit. Ayez un set d'avance pour le Grand Chelem 2016.

Explication des paris à handicap au tennis

Analyste spécialiste des paris, Joseph gère le site web Footbal-Data.co.uk, qui publie des résultats passés, les statistiques des matchs et les cotes des paris. Il est également l'auteur de Fixed Odds Sports Betting: Statistical Forecasting &amp; Risk Management (2003), How to Find a Black Cat in a Coal Cellar: The Truth about Sports Tipsters (2013) et Squares &amp; Sharps, Suckers &amp; Sharks: The Science, Psychology &amp; Philosophy of Gambling (2016).

Joseph Buchdahl

Ces derniers mois, je suis tombé sur bon nombre de sites, de blogs et d'articles de forum qui prétendaient avoir découvert des systèmes de paris lucratifs rien qu'en appliquant rétrospectivement quelques critères de sélection en apparence arbitraires à un grand jeu de données historiques de résultats et de cotes.
Dans cet article, j'étudie les pièges que pose l'utilisation de l'exploration de données pour prendre l'avantage&nbsp;: la corrélation sans causalité est source de problèmes pour le parieur sportif.

<h3>Exploration et triturage de données</h3>

L'exploration de données («&nbsp;data mining&nbsp;») est le processus qui consiste à analyser de grands jeux de données afin d'en dégager des motifs et des informations. Plus spécifiquement, la tâche du triturage de données («&nbsp;data dredging&nbsp;») suppose d'utiliser l'exploration de données pour identifier des schémas dans les données qui peuvent être présentés comme significatifs d'un point de vue statistique.
<blockquote>On ne peut adapter a posteriori une explication pour justifier un résultat, car ce serait prendre le contre-pied de la relation de causalité.</blockquote>
Les paris sportifs se prêtent bien à l'exploration et au triturage de données. Divers sites mettent à disposition de gros volumes de résultats historiques et de cotes sur le football afin de permettre de chercher et de tester rétrospectivement des systèmes de paris lucratifs.
La grande limite de cet outil d'analyse de données, cependant, est que les hypothèses a priori permettant de rendre compte de la présence de ces motifs ne sont généralement pas émises.

<h3>La corrélation sans causalité</h3>

J'ai déjà abordé les <a href="https://www.pinnacle.com/en/betting-articles/educational/confusing-correlation-with-causation/HLF27Z3NJRWTGD8F">pièges posés par la confusion entre corrélation et causalité</a> et entre précision et exactitude ou validité. Pour qu'un système de paris soit valide et remplisse vraiment sa fonction, il faut avoir au préalable une idée de ce qui est à l'origine de sa réussite.
Si l'on n'a pas établi la relation de cause à effet qui se trouve derrière la corrélation, on ne sait absolument pas ce qui peut causer l'effondrement de cette dernière&nbsp;; la corrélation sans causalité n'a aucun sens.

<h3>De la valeur cachée dans la quatrième division du championnat d'Angleterre de football&nbsp;?</h3>

Sur mon fil Twitter, il y a une semaine, mon attention a été attirée par les profits exceptionnels qui auraient pu être dégagés en pariant à l'aveuglette sur toutes les victoires à l'extérieur en quatrième division du championnat d'Angleterre de football (EFL League Two) entre les saisons 2012-2013 et 2016-2017 incluses (presque 3&nbsp;000&nbsp;paris)&nbsp;: 4,3&nbsp;% sur les cotes de clôture de Pinnacle et près de 10&nbsp;% sur les meilleures cotes du marché.
Seule une saison sur les cinq a enregistré une perte par rapport aux cotes de clôture de Pinnacle, et elle était faible. Voici le graphique des gains&nbsp;:
<img src="/sites/default/files/media-image/article-data-mining-3-in-article.jpg" alt="article-data-mining-3-in-article.jpg" width="600" height="415" loading="lazy">
Il était suggéré que le marché sous-estimait les équipes visiteuses de cette division, c'est-à-dire qu'elles étaient surcotées. Ce n'est pas une aberration à court terme, cependant&nbsp;; il s'agirait plutôt d'une erreur constante et systématique dans l'estimation faite par les parieurs de la probabilité de victoires à l'extérieur en EFL League Two, bien au-delà des limites de la marge bénéficiaire du bookmaker. Mais peut-on vraiment penser qu'il y ait ici une quelconque relation de causalité&nbsp;?

<h3>Backer le match nul&nbsp;: si simple en apparence</h3>

Parmi les stratégies que j'ai régulièrement vues publiées figure également celle qui se nomme «&nbsp;backer le match nul&nbsp;» (soit «&nbsp;parier pour&nbsp;» le match nul). Elle revendique un bénéfice de près de 16&nbsp;% sur le chiffre d'affaires après plus de 2&nbsp;500&nbsp;paris, selon des tests effectués rétrospectivement à partir des résultats de football et des cotes de Pinnacle sur les matchs depuis 2012.
Les critères de sélection sont simples&nbsp;: aucune équipe ne doit avoir fait match nul au cours des trois derniers matchs&nbsp;; les cotes doivent être comprises entre 3,20 et 3,56. En testant si ce résultat est statistiquement significatif, on découvre que de tels gains sont en effet exceptionnels. Ces cotes pourraient produire une rentabilité de cet acabit à une fréquence de l'ordre de seulement une fois sur un million, voire moins, à supposer que la tendance soit exclusivement aléatoire.
<div class="articleV2 unordered-list">
<ul>
<li>À lire&nbsp;: <a style="color: #f50;" id="articleLink" href="/betting-resources/fr/betting-strategy/how-good-are-betting-tipsters/lp923gahkwh7nv6a">À quel point les pronostiqueurs de paris sont-ils fiables&nbsp;?</a></li>
</ul>
</div>
On pourrait tout à fait se demander pourquoi ce sont précisément ces critères qui ont été choisis. Pourquoi pas les quatre, les cinq ou les six derniers matchs&nbsp;? Et des cotes comprises entre 3,07 et 3,41, ou entre 3,13 et 3,72&nbsp;? Bien sûr, ces critères n'ont très certainement pas été sélectionnés avant l'exploration des données&nbsp;; il a simplement été découvert qu'ils assuraient les profits que l'on a vus. Et on ne peut adapter a posteriori une explication pour justifier un résultat, car ce serait prendre le contre-pied de la relation de causalité.
<blockquote>Si l'on n'a pas établi la relation de cause à effet qui se trouve derrière la corrélation, on ne sait absolument pas ce qui peut causer l'effondrement de cette dernière.</blockquote>
Pour défendre cette stratégie, on pourrait à présent ajouter&nbsp;: «&nbsp;une fois sur un million&nbsp;: c'est sûrement le signe que ce n'est pas un hasard, n'est-ce pas&nbsp;?&nbsp;». Certes. Cependant, si l'on a un million de stratégies à tester, et que l'on en trouve une qui soit aussi statistiquement significative que celle-ci, que peut-on en déduire&nbsp;? Dans son livre Le hasard sauvage, Nassim Taleb imagine des singes tentant de reproduire la poésie d'Homère sur une machine à écrire&nbsp;:
«&nbsp;S'il y avait cinq singes dans la partie, je serais assez impressionné par celui qui aurait écrit l'Iliade, au point de le suspecter d'être la réincarnation du poète de l'Antiquité. S'ils étaient au nombre d'un milliard puissance un milliard, je le serais moins...&nbsp;»
Comme le souligne Taleb, rares sont les gens qui prennent la peine de compter tous les singes, et, même alors, presque aucun d'entre eux ne dégagerait des motifs intéressants qui mériteraient d'être relevés. Le <a href="https://www.pinnacle.com/en/betting-articles/Betting-Strategy/what-is-survivorship-bias/3DY2T5GERNE7GJYH">biais du survivant</a> fait que l'on ne voit que les vainqueurs.

<h3>Pourquoi les parieurs doivent «&nbsp;compter les singes&nbsp;»</h3>

Si l'on ne propose pas d'hypothèse a priori avant de triturer les données à la recherche de tendances lucratives, il faut au moins tester un grand nombre de systèmes de paris pour déterminer la fréquence à laquelle on en trouve qui soient statistiquement significatifs. Comme je l'ai énoncé en réponse à cette discussion sur mon fil Twitter, «&nbsp;trouvons la distribution des rendements sur 10&nbsp;000&nbsp;échantillons de paris en aveugle sélectionnés selon 10&nbsp;000&nbsp;critères différents, et voyons à quoi elle ressemble.&nbsp;»
Je n'ai pas réussi à trouver 10&nbsp;000&nbsp;échantillons de paris à l'aveugle d'une taille convenable (cela demanderait de gros volumes de données)&nbsp;; j'en ai malgré tout déniché 1&nbsp;686, de 100&nbsp;paris ou plus. Chaque échantillon représentait une série de paris engagés à l'aveuglette sur un résultat précis (victoire de l'équipe locale, match nul ou victoire de l'équipe visiteuse), pour une ligue de football donnée au cours d'une seule saison.
Après avoir retiré la marge de Pinnacle pour trouver les cotes «&nbsp;réelles&nbsp;» de chaque issue, j'ai calculé le rendement théorique de tous les échantillons ainsi que leur statistique&nbsp;t, ma mesure préférée pour savoir s'il est probable ou non que de tels résultats soient le fruit du hasard. Le graphique ci-dessous montre leur distribution. Les scores&nbsp;t positifs représentent des échantillons bénéficiaires, les négatifs des pertes&nbsp;; plus le chiffre est grand, moins il est probable.
<img src="/sites/default/files/media-image/article-data-mining-2-in-article.jpg" alt="article-data-mining-2-in-article.jpg" width="600" height="415" loading="lazy">
Ceux d'entre vous qui connaissent la distribution normale (courbe en cloche) l'identifieront comme un signe de hasard. En d'autres termes, le résultat de ces échantillons de paris à l'aveugle se rapproche étroitement de ce à quoi l'on pourrait s'attendre si tout était purement aléatoire.
<div class="articleV2 unordered-list">
<ul>
<li>À lire&nbsp;: <a style="color: #f50;" id="articleLink" href="/betting-resources/fr/betting-strategy/how-to-use-standard-deviation-for-betting/p8724ge57fbzwd3f">Comment utiliser l'écart type pour parier</a></li>
</ul>
</div>
Lorsque l'on regarde les choses dans leur ensemble, il n'y a manifestement rien ou presque rien de systématique qui se produise. Ces saisons lucratives en quatrième division du championnat d'Angleterre de football n'étaient très probablement rien d'autre qu'un coup de chance, qui a été mis au jour en triturant les données et en tombant sur quelque chose qui ressemblait à un schéma avantageux, causé par un comportement systématiquement irrationnel chez les parieurs ou chez le bookmaker.
Le rendement des cotes «&nbsp;réelles&nbsp;» des cinq saisons prises dans leur ensemble aurait un score&nbsp;t de +2,4, ce qui implique une probabilité (valeur&nbsp;p) de l'ordre de 1 pour 100 qu'il soit le fruit du hasard. D'un point de vue statistique, c'est significatif&nbsp;; si nous souhaitions publier un article de recherche à ce sujet précis, nous serions enclins à le considérer comme une réalité. Mais, en étudiant le tableau dans son ensemble, nous savons que ce n'est très certainement pas le cas, et qu'il s'agit d'un pur hasard.
<blockquote>Si l'on s'efforce de concevoir un système de paris en triturant les données jusqu'à trouver des critères lucratifs, on risque d'omettre d'établir des explications causales qui rendront compte des relations trouvées.</blockquote>
De fait, l'un des échantillons de la saison 2007-2008 de l'EFL League Two était encore plus rémunérateur. Les 242&nbsp;matchs pour lesquels j'ai des données entre décembre et mai ont montré un profit théorique de plus de 29&nbsp;% (ou 35&nbsp;% sur la base des cotes «&nbsp;réelles&nbsp;» une fois la marge retirée). De telles performances pourraient se produire de façon aléatoire environ une fois sur 1&nbsp;000. Il s'agit des meilleures qui ont été obtenues parmi les 1&nbsp;686&nbsp;échantillons.&nbsp;
Au total, 837 d'entre eux, soit environ la moitié, étaient rentables par rapport aux cotes «&nbsp;réelles&nbsp;», comme on pourrait s'y attendre. Dans un ensemble d'échantillons de ce type, on tablerait tout naturellement sur une valeur&nbsp;p d'environ 1 sur 1&nbsp;686 pour le meilleur d'entre eux. À peu près 16&nbsp;échantillons (ou 1&nbsp;%) afficheraient une valeur&nbsp;p de moins de 1 pour 100. De même, la valeur&nbsp;p serait inférieure à 1 sur 10 pour approximativement 168&nbsp;d'entre eux (ou 10&nbsp;%). Tout autre cas de figure nous conduirait à juste titre à nous demander si certains de ces résultats étaient influencés par autre chose que le hasard.
On a en fait obtenu respectivement 15 (0,9&nbsp;%) et 158 (9,4&nbsp;%) échantillons, ce qui est plutôt proche des prévisions. Le graphique ci-dessous compare le pourcentage théorique attendu d'échantillons lucratifs dont la valeur&nbsp;p se situe au-dessous d'un certain seuil (1 pour 10&nbsp;: 10&nbsp;%, 1 pour 5&nbsp;: 20&nbsp;%, etc.) avec la proportion réellement trouvée. L'équivalence presque parfaite saute aux yeux.
En somme, le graphique est un autre moyen de dire que presque tout ce que l'on observe est le fruit du hasard, et rien d'autre. Une rentabilité de 1 sur 1&nbsp;000 est certes impressionnante, mais, si l'on dispose de plus de 1&nbsp;000&nbsp;échantillons, ce n'est pas anormal&nbsp;: il ne s'agit donc pas d'une preuve solide d'une quelconque relation de causalité.&nbsp;
<img src="/sites/default/files/media-image/article-data-mining-1-in-article.jpg" alt="article-data-mining-1-in-article.jpg" width="600" height="415" loading="lazy">

<h3>Que nous apprennent l'exploration et le triturage de données en matière de paris&nbsp;?</h3>

Il n'est peut-être pas étonnant que la distribution de la rentabilité par division de football saisonnière soit aléatoire. Ce n'est pas vraiment le moyen le plus subtil d'élaborer un modèle de paris. Mais voici l'essentiel&nbsp;: si l'on s'efforce de concevoir un système de paris en triturant les données jusqu'à trouver des critères lucratifs, on risque d'omettre d'établir des explications causales qui rendront compte des relations trouvées.&nbsp;
Sauf à avoir une raison qui justifie ce profit, une telle démarche peut se révéler complètement absurde. La corrélation sans causalité <a href="https://www.pinnacle.com/en/betting-articles/Betting-Strategy/regression-to-the-mean-in-sports-betting/EWP2A8KL7MMHUQCM">converge simplement vers la moyenne</a>. Pour un parieur sportif, cela signifie perdre de l'argent sur le long terme.
On pourrait soutenir qu'il n'y a pas de mal à tirer parti de la chance pour gagner de l'argent&nbsp;; c'est après tout l'essence des paris. Dans ce cas, il ne faut néanmoins pas se leurrer en supposant que la réussite obtenue serait le fruit d'autre chose.

Il est courant d'utiliser les données dans une stratégie de paris. Cependant, aussi impressionnants que semblent certains résultats, l'important est le processus permettant d'y parvenir. Découvrez quels sont les problèmes de l'exploration de données dans les paris sportifs.

http://drupal/betting-resources/sites/default/files/styles/other_social/public/media-article/article-data-mining-hero.jpg?itok=S0PpsbP-

https://drupal/betting-resources/sites/default/files/styles/other_social/public/media-article/article-data-mining-hero.jpg?itok=S0PpsbP-

Il est courant d'utiliser les données dans une stratégie de paris. Cependant, aussi impressionnants que semblent certains résultats, l'important est le processus permettant d'y parvenir. Quels sont les problèmes posés par l'exploration de données dans les paris sportifs ? Lisez cet article pour le découvrir.