- |
- |
- |
X1 |
Y1 |
Z1 |
ph |
pd |
pa |
ph |
ph + pd |
ph + pd + pa |
0,211 |
0,245 |
0,544 |
0,211 |
0,456 |
1 |
Pinnacle es conocido por la eficiencia de sus mercados de apuestas, especialmente en deportes populares como el fútbol. Si bien ya se han analizado en varias oportunidades las razones de la eficiencia de estos mercados, nos preguntamos si es posible que estén volviéndose aún más eficientes. Continúa leyendo para averiguarlo.
Hace años que escribo para la sección Recursos de apuestas de Pinnacle, por lo que los lectores ya conocen mi opinión sobre la eficiencia del mercado. En pocas palabras, la eficiencia es solamente otra manera de denominar la precisión. Cuando decimos que un mercado de precios de apuestas es eficiente, lo que queremos decir es que dichos precios representan de forma precisa las verdaderas probabilidades de los resultados en un partido de fútbol en particular.
Para algunos, este concepto puede resultar difícil de entender. El problema es el siguiente: las cuotas reflejan las probabilidades, pero los resultados son binarios; pueden ser ganadores (100 %) o perdedores (0 %). En este sentido, todas las cuotas son imprecisas, ya que no reflejan los resultados. Es necesario usar un poco la imaginación para entender que estos resultados representan solamente una serie de eventos posibles. Pero la respuesta a cuál de ellos veremos se esconde en la naturaleza de la incertidumbre.
Si pudiéramos hacer que los partidos de fútbol se jugaran indefinidamente, veríamos una distribución en los resultados: a veces una victoria de local, a veces un empate y a veces una victoria de visitante. La forma en que las probabilidades implícitas reflejan esta distribución permite medir la precisión o eficiencia de las cuotas de apuestas subyacentes.
¿Cómo se mide la precisión de los mercados de fútbol?
Lamentablemente, la única información con la que contamos para intentar medir la precisión de los mercados de fútbol de Pinnacle son los resultados reales. Nunca sabremos con exactitud cuáles son las verdaderas probabilidades subyacentes. Para saber en qué medida las cuotas reflejan los resultados reales podemos utilizar lo que se conoce como regla de puntuación. Esta regla mide la precisión de los pronósticos probabilísticos.
Pinnacle ya ha publicado un artículo en Recursos de apuestas sobre una regla de puntuación muy conocida: la puntuación de Brier. Otra de ellas es la puntuación de ignorancia o información faltante, que se relaciona con la entropía de Shannon o la información dentro de una variable aleatoria de los resultados posibles. En este artículo explicaré otra regla más: la puntuación de rango de probabilidad.
Guía para entender la puntuación de rango de probabilidad
La puntuación de rango de probabilidad (PRP) es una regla de puntuación para resultados probabilísticos que tiene en cuenta la distancia o el orden. Puntuar la precisión de las cuotas de fútbol en relación con los resultados significa que un empate se acerca más a una victoria de local que a una de visitante (y viceversa). Su aplicación en el fútbol surgió con la literatura académica en 2012. La ecuación para calcular la PRP es la siguiente:
donde r es la cantidad de resultados posibles (en un mercado de apuestas de un partido de fútbol es 3), y pj y ej son los pronósticos de probabilidad y los resultados observados en la posición j. Desde el punto de vista cualitativo, la PRP representa la suma del cuadrado de la diferencia entre las distribuciones acumulativas de los pronósticos y las observaciones, y se encuentra en 0 (para un pronóstico perfecto) y 1 (para uno completamente imperfecto). Un ejemplo práctico nos aclarará un poco las cosas.
Comencemos con algunas cuotas sencillas (sin el margen del corredor) para el partido que jugó Manchester United contra Manchester City el 8 de marzo de 2020. En función del mercado promedio, las probabilidades de lograr una victoria de local, un empate y una victoria de visitante (ph, pd y pa) eran de 0,211, 0,245 y 0,544 respectivamente. Manchester United ganó el partido, por lo que eh equivale a 1, mientras que ed y ea equivalen a 0.
Primero calculemos las probabilidades de pronóstico acumulativas. En la primera tabla vemos cómo hacerlo.
Ahora hagamos lo mismo para los resultados.
Finalmente, se calcula el cuadrado de la diferencia entre ambas para cada resultado posible, se suma y se divide por 2 (dado que r – 1 = 2 cuando r es 3).
En caso de que ocurriera el resultado menos predecible, la PRP sería bastante alta. Si Manchester City hubiese ganado el partido, la PRP habría sido de 0,126.
Uno de los beneficios de utilizar una regla de puntuación que tiene en cuenta la distancia es la capacidad de generar puntuaciones más bajas para los empates cuando el nivel de los equipos es parejo. Burley empató con Tottenhamel el 7 de marzo. Ambos equipos tenían la misma probabilidad (35,7 %). La PRP era de 0,127, a pesar de que el empate en realidad era el resultado menos probable de los tres (28,7 %). Si cualquiera de los equipos hubiera ganado, la PRP para el partido habría sido de 0,270.
Si bien el empate era el resultado menos probable, desde un punto de vista intuitivo parece tener sentido, al menos desde la perspectiva de una regla de puntuación y a partir de la forma en que las probabilidades modelo (en este caso las cuotas) reflejan los eventos del mundo real, aunque este razonamiento ha generado disputas.
El uso de la puntuación de rango de probabilidades para calcular la eficiencia del mercado
En teoría, se puede conocer la eficiencia de los precios de apuesta en un mercado al calcular la PRP promedio de una muestra de partidos. Cuanto más baja sea la puntuación, más eficiente será el mercado y más preciso será el modelo de cuotas. Realicé el siguiente cálculo para una muestra grande (n = 162 282) de partidos de fútbol jugados entre 2007 y 2017 a nivel mundial. La PRP promedio de las cuotas finales de Pinnacle era de 0,2046.
En las ligas más pequeñas hay menos información, más incertidumbre y más diferencias. Por ello, Pinnacle limita el tamaño de la apuesta permitida para impedir que los clientes se aprovechen de la gran probabilidad de error.
Al no contar con un punto de referencia, es difícil saber qué significa la cifra y qué indica sobre la precisión de las cuotas de apuesta. En el caso de un partido individual, sabemos que todas las cuotas son 'incorrectas' en un sentido determinista. La pregunta es, ¿cuán incorrectas son? La puntuación perfecta sería 0, pero obviamente ningún modelo de cuotas puede lograrla.
El modelo de cuotas más simple que podemos utilizar es la suposición. Mediante un generador aleatorio de números de Excel, calculé las probabilidades de empate, victoria de local y victoria de visitante al azar y luego calculé la PRP en función del mismo grupo de resultados reales del partido. La PRP promedio calculada en una simulación de Montecarlo fue de 0,293. Evidentemente, las cuotas finales de Pinnacle son estadísticamente mucho mejores que la suposición aleatoria como modelo predictivo (hasta 451 desviaciones típicas).
Cualquier aficionado al fútbol sabe, sin embargo, que las victorias de local son mucho más probables que los empates y las victorias de visitante, al menos en promedio. Si analizamos mínimamente los datos históricos, descubriremos que cerca del 45 % de los partidos culminan con una victoria de local, mientras que aproximadamente un 27 % y un 28 % terminan con un empate y victoria de visitante, respectivamente. ¿Qué pasa si utilizamos estas cifras en cada uno de los partidos de esta muestra? En este caso, la PRP desciende a 0,225, mejor que el resultado aleatorio pero aún mucho menos precisa que las cuotas finales de Pinnacle.
Cuotas iniciales vs. cuotas finales
¿En qué se asemejan las cuotas iniciales y las cuotas finales de Pinnacle? Intuitivamente, muchas personas creen que a medida que un mercado de apuestas evoluciona y se reflejan más acciones y opiniones con más dinero, las cuotas deberían mejorar.
La PRP promedio para la muestra de partidos era de 0,2059. Esta cifra es más alta que la de los precios finales, a pesar de que la diferencia es pequeña. ¿Una diferencia tan pequeña como esta puede ser la prueba del aumento en la eficiencia de los precios entre un mercado inicial y uno final?
Una forma de comprobarlo es observar cuán acertadas o desacertadas son estas cifras de PRP. Es importante recordar que los resultados están determinados, en gran medida, por el azar. Esto se conoce como incertidumbre aleatoria o estadística. No obtendremos los mismos resultados todas las veces. Los resultados reales ofrecen solo una serie de 3 de las 162 282 series posibles (calculo que ese número se compone de 77 000 cifras).
En lugar de utilizar los resultados reales, calculémoslos de forma aleatoria y definamos las probabilidades mediante las cuotas iniciales y finales de Pinnacle para conocer el rango estimado de PRP con una simulación de Montecarlo.
Para las cuotas finales, la PRP estimada (promedio) era de 0,2045 con una desviación típica de 0,0003. Esto quiere decir que aproximadamente dos tercios de los valores de PRP con el modelo de cuotas finales habrían dado como resultado entre 0,2042 y 0,2048. Esto incluye los resultados de PRP reales. Aproximadamente un 99,8 % se encontraría dentro de las 3 desviaciones típicas, como por ejemplo 0,2036 y 0,2054. Del mismo modo, las cuotas iniciales tendrían un promedio de 0,2056 y nuevamente una desviación típica de 0,0003.
Dado que la diferencia entre los resultados reales de la PRP para las cuotas iniciales y finales es de 0,13 (o más de 4 de desviación típica), esto supondría una diferencia estadísticamente significativa entre los dos modelos de cuotas y ello implicaría que las cuotas finales son en realidad más eficientes (o precisas) que las iniciales. Del mismo modo, una prueba t de una cola realizada sobre las PRP reales del partido para las cuotas iniciales y finales tiene un valor p de aproximadamente 0,001 (equivalente a una desviación típica de 3 y algo, grosso modo)
¿Los mercados de fútbol de Pinnacle se han vuelto más eficientes?
Ocupémonos ahora de la pregunta planteada en el título de este artículo: ¿las cuotas de apuestas de fútbol de Pinnacle se vuelven más eficientes con el paso del tiempo? Separé las PRP por año calendario y volqué la tendencia en el siguiente gráfico:
Si bien se observa una diferencia importante entre un año y otro, que de hecho era esperable debido no solo a la aleatoriedad de los resultados reales sino también a los diferentes partidos a cuenta de los ascensos y descensos anuales, los miembros del equipo y la formación, parece haber una tendencia a una mayor eficiencia.
Un punto interesante es que los precios finales parecen haberse vuelto más eficientes de forma más rápida que los iniciales. Las PRP promedio de los precios iniciales son un reflejo de la precisión del modelo de creación de cuotas de Pinnacle. Las PRP promedio de las cuotas finales, por el contrario, son un reflejo de los modelos de todos los clientes de Pinnacle, además del modelo propio. El hecho de que los precios parecen haberse vuelto relativamente más eficientes entre 2007 y 2017 podría indicar que un mayor número de clientes compite tanto contra Pinnacle como entre sí de forma pasiva en una 'carrera armamentista' por lograr un nivel aún mayor de precisión en sus pronósticos.
¿Qué ligas de fútbol se han vuelto más eficientes?
En general, se cree que es mucho más fácil vencer al corredor en un mercado más pequeño y menos eficiente que en uno con un gran volumen de operaciones y gran cantidad de clientes. Es una creencia por completo razonable, en especial si se tiene en cuenta que Pinnacle aplica diferentes límites de apuesta a las distintas ligas específicamente con el fin de controlar los riesgos.
En las ligas más pequeñas hay menos información, más incertidumbre y más diferencias. Por ello, Pinnacle limita el tamaño de la apuesta permitida para impedir que los clientes se aprovechen de la gran probabilidad de error. Una liga europea de división inferior puede tener límites de apuesta de hasta unos pocos cientos de dólares. Por el contrario, un partido de la Premier League o de la Champions League puede tener límites de hasta $45 000.
En el siguiente cuadro se desglosa la información del primer cuadro en 'grandes' y 'pequeñas' ligas o competencias de fútbol. El criterio que utilicé para determinar cuáles eran 'grandes' y cuáles 'pequeñas' fue bastante arbitrario y subjetivo, pero basado, espero, en el sentido común. Por ende, las ligas 'grandes' incluyen a las primeras divisiones de Inglaterra, Escocia, España, Italia, Alemania y Francia, además de la Champions League, la Europa League, la European Cup y la World Cup: aproximadamente un 15 % de la muestra total.
Se pueden mencionar dos puntos al respecto. En primer lugar, los mercados 'grandes' tienen una PRP promedio más baja que los 'pequeños'. De hecho, la diferencia es estadísticamente enorme. Tanto para los precios iniciales como para los finales, la probabilidad de que esto suceda por azar es de aproximadamente 1 en 50 mil millones. En segundo lugar, los mercados 'grandes' tenían PRP más bajas en general y eran implícitamente más eficientes y rápidos. De hecho, los mercados 'pequeños' prácticamente no se modificaron.
¿Por qué los mercados grandes mostraron una tendencia más rápida hacia la eficiencia? Una posible explicación es que los intereses de los clientes en los mercados grandes aumentó más rápido que en los mercados pequeños. Resulta lógico, dado que las estrategias publicitarias de los deportes tanto en internet como en la televisión se han enfocado en las competencias más importantes.
Pero, ¿el promedio de PRP estadísticamente bajo de los mercados grandes es realmente consecuencia de la eficiencia? Sin dudas, esta es una forma de explicarlo. Pero otra explicación asegura que en las competencias más 'grandes' generalmente hay favoritos más populares y no favoritos mejor cotizados. Esto quiere decir que hay una mayor diferencia en las probabilidades de los tres resultados de los partidos.
Intentar determinar cuál es la correcta pone en evidencia un problema muy importante de utilizar la PRP y en realidad cualquier regla de puntuación: determinar qué dice sobre la precisión de los pronósticos probabilísticos.
¿Qué sucede con la incertidumbre epistémica?
Imaginemos que el modelo para un partido pronostica 45 % para la victoria de local, 27 % para el empate y 28 % para la victoria de visitante. Si el modelo fuera correcto, la PRP estimada sería de 0,225. La incertidumbre aleatoria determinada por la influencia del azar en un partido indica que la puntuación real podría ser de 0,191 (victoria de local), 0,140 (empate) o 0,360 (victoria de visitante). No obstante, si estos partidos se jugaran una cantidad infinita de veces, la PRP promedio sería de 0,225.
Ahora imaginemos que el modelo pronostica 70 %, 20 % y 10 %. La diferencia de probabilidad entre los tres resultados es mayor, al igual que la diferencia entre las tres PRP posibles (victoria de local = 0,05, empate = 0,25, victoria de visitante = 0,65) pero ahora la PRP estimada disminuye a 0,150.
Si bien los mercados grandes pueden ser más eficientes que los pequeños, una explicación alternativa podría ser la mayor presencia de favoritos populares.
Si ambos modelos fueran correctos, la PRP disminuiría al haber mayor incertidumbre en uno o más resultados en particular. Esto representa una razón obvia por la que la PRP promedio en los mercados grandes es menor que en los pequeños. En los mercados 'grandes', cerca del 5 % de las cuotas de mi muestra tenían una probabilidad de victoria implícita de más del 70 %. En los mercados 'pequeños' era solo del 2 %. Del mismo modo, más del 20 % de las cuotas de los mercados 'grandes' tenía probabilidades de victoria de menos del 20 % en comparación con el 13 % de los mercados 'pequeños'.
Si pensamos en los equipos dominantes de las competencias 'grandes' como Madrid, Barcelona, Juventus, Manchester City, Chelsea, Celtic, PSG y Bayern Munich durante el período de la muestra, la diferencia resulta lógica. Las competencias 'grandes' tienen más cantidad de favoritos populares y, por ende, más cantidad de equipos que quedan fuera de este rango. Las cuotas muestran una asimetría en comparación con sus probabilidades implícitas, por lo que en las competencias 'grandes' el promedio de las cuotas es mayor.
Ahora, imaginemos que el segundo modelo de mi experimento es completamente errado. Imaginemos también que las verdaderas probabilidades son de 60 %, 25 % y 15 %. En este caso, la PRP estimada ascendería a 0,190 porque existen más cantidad de victorias de visitante que las que el modelo calculó que debería haber. Sin embargo, la PRP estimada sigue siendo más baja que la que pronostica el primer modelo para los partidos, lo que implica una serie de pronósticos más precisos (aunque sabemos que esto es falso). Solo aparentan ser más precisos porque la diferencia de probabilidad entre los tres resultados posibles es mayor en esta muestra de partidos.
La incertidumbre (o error) sistemática en un modelo se conoce como incertidumbre epistémica. El problema es el siguiente: cuando se tienen muestras de PRP, ¿cómo se determina el nivel de incertidumbre epistémica que hay? Es imposible determinarlo solamente por las cifras de las PRP. Las cuotas de los mercados de fútbol más grandes pueden parecer más precisas (y eficientes) simplemente por presentar una PRP promedio más baja. Sin embargo, ya hemos visto que esto podría tratarse muy fácilmente de una ilusión. Una PRP promedio más baja no necesariamente implica que el modelo de pronóstico es más preciso.
¿Qué aprendimos?
La puntuación de rango de probabilidad se puede utilizar para medir la precisión de los pronósticos probabilísticos de un mercado de apuestas de fútbol.
Al utilizar la PRP, se observa que las cuotas finales son más eficientes que las iniciales y que se han vuelto relativamente más eficientes con el paso del tiempo. Es más, si bien los mercados grandes pueden ser más eficientes que los pequeños, una explicación alternativa podría ser la mayor presencia de favoritos populares.
Sin embargo, la incertidumbre epistémica subyacente en el modelo utilizado para pronosticar las probabilidades de los resultados limita la forma de traducir estas puntuaciones en un análisis de los modelos subyacentes.
En conclusión, debemos ser precavidos a la hora de sacar conclusiones sobre la eficiencia de un mercado de apuestas de fútbol de Pinnacle. El problema principal es que nunca sabremos las verdaderas probabilidades que existen en un partido de fútbol. Si las supiéramos, seríamos multimillonarios.