août 13, 2015
août 13, 2015

Évaluation de la qualité d'adéquation

Évaluation de la qualité d'adéquation
Pour bénéficier d'un modèle de pari efficace, tous les parieurs doivent recueillir le plus de données possible. Mais à quel point les données s'adaptent-elles à certains scénarios attendus ? Dominic Cortis nous explique l'importance du concept de "qualité d'adéquation" lors de l'analyse des données.

La modélisation et le test des résultats impliquent une comparaison des valeurs attendues dans un environnement utopique avec de valeurs observées réelles. Le magazine Pinnacle Pulse a publié plusieurs articles décrivant les types de lois et les résultats. Dans un article précédent, j'ai précisé que certaines erreurs peuvent être dues au fait que bien que le modèle utilisé soit correct, des paramètres incorrects sont appliqués, par exemple en raison d'un petit échantillon avec une grande valeur.

En termes techniques, nous évaluons "la qualité d'adéquation", c'est-à-dire à quel point les données observées s'adaptent au scénario attendu.

Il est anormal de trouver la forme de taille correcte (pas le type de forme), comme expliqué dans l'article consacré aux "erreurs dans les modèles". Pour mesurer cette valeur, la méthode la plus simple consiste à effectuer le test du χ2 (prononcez test du "chi carré").

Le lancer de dé

Si un dé est lancé 60 fois, nous attendons 10 observations de chaque chiffre (1, 2, , 6). Il ne faut pas se laisser abuser et penser que si le chiffre 2 apparaît 10 fois au bout de 40 lancers, il risque de ne plus ressortir.

Ainsi, si un dé lancé indique 9, 11, 10, 9, 12 et 9 observations de 1, 2, 3, 4, 5 et 6 respectivement, pouvons-nous affirmer que ce dé est truqué ? Après tout, cette série est bien différente de 10 observations de chaque chiffre, mais la question est de savoir si cette méthode est radicalement différente.

L'écart (la différence entre les valeurs observées et les valeurs attendues), varie de -2 à 1, comme l'indique le tableau ci-dessous.

Valeur

1

2

3

4

5

6

Attendue = E

10

10

10

10

10

10

Observée = O

9

11

10

9

12

9

Écart = E - O

1

1

0

1

-2

1

[E – O]² ÷ E

0,1

0,1

0

0,1

0,4

0,1

Nous souhaitons mesurer l'écart global pour déterminer à quel point le lancer de dé diffère du scénario utopique. L'addition des écarts est égale à 0 puisque les valeurs observées et les valeurs attendues correspondent à 60 lancers

Il existe une multitude de façons d'aborder cette question, notamment en utilisant des valeurs absolues (rendre toutes les valeurs positives) ou des différences de pourcentage.

Cependant, pour obtenir des propriétés mathématiques "optimales", nous allons mesurer la variation relative dans l'écart quadratique. Cette méthode consiste à élever au carré chaque écart puis à le diviser par la valeur attendue.

Par exemple, pour les 12 observations du chiffre 5, nous obtenons 2^2 ÷ 10 = 0,4. Si nous ajoutons toutes ces valeurs, le résultat est χ2 de 0,8.

Le test du "chi carré"

La valeur χ2 mesure l'écart global entre les fréquences observées et les fréquences attendues : plus cet écart est important, plus ces deux valeurs sont différentes. Même s'il est possible de mesurer avec exactitude cet écart, nous utiliserons un seuil limite pour plus de simplicité.

Ces résultats se retrouvent dans n'importe quel tableau statistique, et si nous utilisons le jeu de tableaux de la Royal Statistical Society (page 6), nous obtenons de nombreux seuils limites. Utilisons la valeur 0,05, qui correspond à niveau de signification de 5 %.

Alors que la loi normale repose sur deux paramètres (la moyenne et l'écart-type) et la loi de Poisson sur un paramètre (la moyenne), la loi du chi carré est basée sur un paramètre : le degré de liberté.

Dans ce cas, nous avons 6 résultats possibles, et la valeur requise correspond à un degré de liberté (v) inférieur d'une unité, soit 5. Notre valeur χ2 critique, c'est-à-dire la valeur que χdoit dépasser pour indiquer une différence, est 11,070.

Comme notre valeur est beaucoup plus faible, il n'existe aucune preuve que ce dé est différent.

ChiSquare.png

Figure 1 : Tableau du chi carré dans les tableaux statistiques de la Royal Statistical Society

Cette opération étant relativement longue, nous avons également créé une petite application ci-dessous, qui vous permet de comparer les valeurs observées et les valeurs attendues.

Vérifiez dans les résultats si les valeurs observées ont été multipliées par 10 (Observées = 90, 110,  ; valeurs attendues = 100 chacune) ou par 100 (900, 1100, vous devriez constater que bien que les proportions soient similaires, il apparaît évident qu'un dé n'est pas équitable sur les échantillons plus importants. En effet, un léger écart est possible, mais un écart constant est une preuve plus nette de divergence.

Limitations

Cela nous conduit à une limitation clé de test : il indique bien une différence (sans la prouver), mais l'absence de preuve d'une différence ne signifie pas pour autant que ces valeurs sont identiques. Par ailleurs, l'application ci-dessus n'utilise qu'un niveau de signification de 5 %. Cela reviendrait à considérer que les écarts qui se produiront dans moins de 1 cas sur 20 dans un scénario utopique sont un signe de différence. Pour conclure, un test de chi carré a besoin d'au moins 5 valeurs attendues pour chaque catégorie.  

Testez-la vous-même.

L'application de test du chi carré

ObservéesAttendues

Résultats

Vous vous sentez mieux armé pour trouver un modèle de pari plus efficace ? Inscrivez-vous et créez un compte sur Pinnacle pour obtenir les meilleures cotes et les limites les plus élevées disponibles en ligne. Si les paris sportifs sont nouveaux pour vous, consultez notre page utile d'articles consacrés aux paris.

Ressources sur les paris - Vous aider à mieux parier

Les Ressources sur les paris de Pinnacle constituent la bibliothèque en ligne la plus complète de conseils d'experts sur les paris. Notre objectif est tout simplement de permettre aux parieurs d'acquérir davantage de connaissances, quel que soit leur niveau d'expérience.