nov. 2, 2015
nov. 2, 2015

Comment utiliser le "bootstrap" en cas de données limitées

Comment utiliser le "bootstrap" en cas de données limitées
Que faire lorsque la saison ne fait que commencer et qu'il n'existe pas encore assez de données pour tirer des conclusions fiables ? Dans cet article, Dominic explique comment le "bootstrap" peut être utilisé pour minimiser les effets d'une erreur de paramètres due à de petits échantillons, à l'aide de deux exemples.

Comme nous l'avons expliqué dans un article Pinnacle précédent, la loi de Poisson représente une méthode clé pour développer des pronostics sur des matches de football. Découvrez comment parier sur le gagnant d'un match de football à l'aide de la loi de Poisson ici.

En fait, elle attribue une valeur moyenne attendue pour le score à une équipe jouant à domicile, en fonction de ses performances d'attaque et des performances défensives de l'équipe qui se déplace.  Elle attribue également une valeur moyenne attendue pour le score à l'équipe qui se déplace.

Cependant, en début de saison, cette méthode présente un problème car il n'y a pas assez de matches à échantillonner. En outre, si un match a eu des résultats extrêmes comme un score très élevé ou une série de matches sans buts, l'impact est grand sur l'estimation.

Les erreurs paramétriques seraient importantes. Vous trouverez plus d'informations sur la façon de concevoir un modèle de paris sportifs ici.

Pour limiter la quantité d'erreurs paramétriques, il est suggéré d'utiliser des techniques de bootstrap. Le bootstrap se rapporte à une solution dans laquelle les tailles des échantillons sont inventées.

Au moment où nous écrivons cet article, la plupart des équipes de Premiership ont joué moins de 5 matches à domicile et 5 matches à l'extérieur chacune.

À titre d'exemple, je recommande deux méthodes.

Méthode 1 : L'approche directe

Cette méthode permet d'échantillonner avec des valeurs de remplacement, c'est-à-dire créer des tailles d'échantillon similaires avec la possibilité de choisir la même valeur plus d'une fois.

Prenons l'exemple des matches à domicile de Leicester City : à ce jour, l'équipe a marqué le nombre de buts suivant contre Aston Villa, West Ham, Arsenal et Crystal Palace respectivement : 3, 2, 2 et 1. Cet échantillon présente une moyenne de 2 buts à domicile par match. 

Créons maintenant un autre échantillon aléatoire de quatre buts à l'aide de ces valeurs. Cette méthode ressemble à la création de valeurs aléatoires à partir de la simulation de Monte Carlo. Les nouveaux ensembles d'échantillons pourraient donc être les suivants :

  •       Échantillon 1 : 2,2,2,1
  •       Échantillon 2 : 1,1,3,2
  •       Échantillon 3 : 3,3,2,2
  •       Échantillon 4 : 1,2,1,1

Notez que 2 buts devraient avoir deux fois plus de changes d'être nuls que 1 et 3 buts à chaque nul, et il se peut que la moyenne soit différente dans chaque cas, elle n'est pas toujours de 2.

Dans ce cas, les moyennes par échantillon sont de 1,75, 1,75, 2,5 et 1,25 respectivement. Nous pensons que la moyenne est de 2, mais nos valeurs montrent qu'elle peut s'étaler de 1,25 à 2,5.

Il est possible d'étendre cela en calculant un nombre significatif d'échantillons bootstrap différents et de constater l'écart type des résultats.

Méthode 2 : Allons plus loin

Pour les matches de Leicester, nous pourrions générer un "score attendu". Cela est possible comme avec la méthode de Poisson, mais en utilisant les données de la saison précédente.

Prenons l'exemple du match contre Aston Villa par exemple. Le nombre moyen de buts marqués à domicile au cours de la saison 2014/15  de Premiership était de 1,474. Leicester a marqué 28 buts lors de 19 matches à domicile alors qu'Aston Villa a concédé seulement 32 buts lors de 19 matches à l'extérieur.

Ainsi, la "force d'attaque" de Leicester est de 1, indiquant un résultat typique à domicile. À l'inverse, Aston Villa a concédé en moyenne 1,684.

Si nous divisons ce résultat par 1,474, nous obtenons 114,29 %, ce qui indique qu'Aston Villa a concédé 14 % de buts en plus que d'habitude en jouant à l'extérieur. Ainsi, l'on peut s'attendre à ce que Leicester marque une moyenne de  1*1,1429*1,474 = 1,684 buts à domicile face à Aston Villa. 

En répétant le même processus pour tous leurs matches, le nombre attendu de buts marqués par match est indiqué dans le tableau ci-dessous. Nous voyons ici que Leicester a eu de meilleures performances que prévu en marquant plus de buts que les estimations, à l'exception du match contre Crystal Palace.

Cela est indiqué à la ligne appelée Différence, pour laquelle le terme technique est "valeur résiduelle".

Équipe Aston Villa West Ham Arsenal Crystal Palace
Buts attendus 1,684 1,526 1,158 1,263
Buts réels 3 2 2 1
Différence 1,316 0,474 0,842 -0,263

À l'instar de la méthode 1, nous avons maintenant un échantillon avec des valeurs résiduelles. Voici des possibilités d'échantillons de valeurs résiduelles :

  •       Échantillon 1 : 1,316, 1,316, 0,474, 0,474
  •       Échantillon 2 : 0,474, -0,263, -0,263, 0,474

Nous ajoutons maintenant ces valeurs résiduelles d'échantillons aux scores attendus pour obtenir d'autres échantillons de buts marqués à domicile :

  •       Échantillon 1 : 3,000, 2,842, 1,632, 1,737
  •       Échantillon 2 : 2,158, 1,263, 0,895, 1,737

Chaque échantillon disposera de sa propre moyenne, que nous pouvons utiliser pour différents paramètres afin de calculer le nombre moyen de buts marqués par l'équipe qui reçoit.

Conclusion

Il ne s'agit pas exactement d'un calcul sommaire mais des connaissances étendues en programmation ne sont pas non plus nécessaires. Utilisez un tableur pour tester la plage de paramètres possibles. Gardez cependant à l'esprit que vous devrez aussi analyser les valeurs résiduelles sur le nombre attendu de buts marqués par l'équipe en déplacement si vous utilisez la seconde méthode décrite ci-dessus. 

strategy-openaccount.jpg

Ressources sur les paris - Vous aider à mieux parier

Les Ressources sur les paris de Pinnacle constituent la bibliothèque en ligne la plus complète de conseils d'experts sur les paris. Notre objectif est tout simplement de permettre aux parieurs d'acquérir davantage de connaissances, quel que soit leur niveau d'expérience.