jun 5, 2020
jun 5, 2020

La asimetría de las apuestas

Dos tipos de incertidumbre

Modelar la incertidumbre en un contexto de apuestas

El mundo real de las apuestas

La asimetría de las apuestas

Es sabido que ganarle a un corredor de apuestas, especialmente uno como Pinnacle, es una tarea muy desafiante. Pero, ¿por qué resulta tan difícil? ¿Mirar las cosas desde la perspectiva de un corredor de apuestas puede ayudarnos a entender qué tan buenos debemos ser para ganar apuestas deportivas? Continúe leyendo para averiguarlo.  

En estos meses de inactividad deportiva, me puse a pensar si es posible medir qué tan buenos tienen que ser los apostadores para ganarle al corredor de apuestas. Como de costumbre, no estoy hablando de ganadores afortunados, sino de una rentabilidad esperada a largo plazo a través de los principios de apuestas con valor.

Evidentemente, sabemos que para lograrlo debemos superar el margen del corredor de apuestas. El hecho de que solo una pequeña cantidad de apostadores probablemente logre esto prueba que esta es una tarea bastante difícil, incluso cuando hay algunos márgenes de tan solo 2 %.

Aquellas personas que leyeron mis artículos o me siguen en Twitter saben que compartí varias herramientas de Excel para medir las probabilidades estadísticas de alcanzar el valor esperado rentable y la manera en que se prevé que estos desempeños se distribuyan sobre la base de determinadas suposiciones de apuestas.

Sin embargo, esta vez quiero investigar exactamente qué significa “ser mejor que el corredor de apuestas” desde la perspectiva de la incertidumbre. Como sabrán, las apuestas son un negocio incierto, incluso para los mejores pronosticadores. ¿Cuánta menos incertidumbre debemos tener para superar el margen y convertirnos en ganadores a largo plazo?

Si intentamos simular una respuesta, se hace evidente lo eficiente que es el corredor de apuestas y por qué debe serlo para mantener la rentabilidad. Esta es la asimetría de las apuestas.

Dos tipos de incertidumbre

En mis últimos dos artículos de Pinnacle, he hablado sobre dos tipos de incertidumbre. Primero, la incertidumbre aleatoria o estadística. Se refiere a la incertidumbre inherente debido a la variabilidad probabilística. Si repetimos un proceso varias veces, por ejemplo si lanzamos una moneda al aire, algunas variaciones sutiles en las condiciones iniciales arrojarán diferentes resultados. Estas diferencias permanecen desconocidas. La incertidumbre aleatoria es irreducible. 

Hay algunas teorías, como el demonio de Laplace, que pueden argumentar que esta es una mera consecuencia de la información limitada y la capacidad de procesamiento. Si pudiéramos conocer todas las condiciones iniciales a la perfección, deberíamos poder predecir con certeza los resultados precisos.

En la práctica, la complejidad de estos sistemas reduce la recopilación de datos al nivel de lo imposible. Sin embargo, quizás lo más importante sea que la naturaleza probabilística en lugar de determinística de la realidad a pequeñas escalas significa que, incluso teóricamente, esta tarea está destinada al fracaso.

Si el corredor de apuestas dedica mucho tiempo a la evaluación de las cuotas reales, es muy probable que el apostador haga lo mismo, y viceversa. Es posible que algunos apostadores también estén sujetos parcialmente al precio del corredor de apuestas.

Es precisamente por esto que tiene sentido hablar sobre probabilidades “verdaderas” de resultados y no dejarse engañar y creer que las probabilidades son del 0 % o del 100 %. En los deportes, a diferencia de lanzar una moneda al aire o tirar los dados, no conocemos, y no podemos conocer, las probabilidades “verdaderas” (por eso usamos comillas), pero tiene sentido hablar como si existieran.

El segundo tipo de incertidumbre es la incertidumbre epistémica o modelo, que surge por no comprender completamente lo que intentamos modelar. La incertidumbre epistémica puede reducirse si contamos con conocimientos adicionales acerca del modelo.

El objetivo de la cuantificación de incertidumbre es reducir las incertidumbres epistémicas a incertidumbres aleatorias, aunque en la práctica, debido a la complejidad del sistema y la naturaleza probabilística de la realidad, el límite entre las dos puede ser confuso.

En este brillante artículo llamado “Toward a theory of everything” de Pinnacle, el autor invitado @PlusEVAnalytics describe estos dos tipos de incertidumbre respectivamente como incertidumbre de proceso (aleatoria) y de parámetro (epistémica). Trataremos de aclarar la diferencia al reproducir su ejemplo.

“Supongamos que le damos a un equipo de fútbol una probabilidad del 60 % de que alcance una victoria, apostamos dinero parejo y el equipo pierde. ¿Por qué perdimos la apuesta? Quizás nuestra evaluación fue correcta, pero no tuvimos suerte; sucedió el evento del 40 % y perdimos la apuesta. Esta es una incertidumbre de proceso (aleatoria): una buena apuesta, un resultado sin suerte. Por otro lado, quizás nos equivocamos en la evaluación. La probabilidad verdadera pudo haber sido del 50 %, 30 % o incluso del 1 %. Hicimos una apuesta que pensamos que era buena, pero, en realidad, era una mala apuesta. Esta es la incertidumbre de parámetro (epistémica). Dado que no conocemos la probabilidad verdadera, es muy difícil determinar qué parte de los resultados, tanto buenos como malos, están impulsados por la incertidumbre de proceso frente a la incertidumbre de parámetro”.

Modelar la incertidumbre en un contexto de apuestas

En un entorno de apuestas, la incertidumbre aleatoria será la misma para todos. Se llevan a cabo los mismos eventos en una competencia deportiva, con las mismas variables de influencia. Todos los apostadores viven la misma historia.

Es relativamente sencillo modelar la incertidumbre aleatoria a través de un simple generador de números aleatorios. Supongamos que tenemos una competencia 50-50, con cuotas equitativas de 2,00. Para modelar la incertidumbre aleatoria, podemos usar un generador de números aleatorios para producir números entre 0 y 1. Un número inferior a 0,5 es una apuesta ganadora; un número superior, es una apuesta perdedora. La distribución de resultados (apuestas ganadoras y perdedoras) entonces sería binomial.

Modelar la incertidumbre epistémica es un poco más problemático debido a que no resulta tan evidente cómo sería el tipo de distribución a partir de los errores que surjan. @PlusEVAnalytics utilizó una distribución beta para modelarla, pero es mucho más inteligente que yo, así que recurriré a la pereza de la distribución normal. Además, asumiré que esta distribución de errores epistémicos se centra en la probabilidad del resultado verdadero, como describo abajo. Naturalmente, si existen sesgos sistemáticos, esto no se aplicará.

Al menos para el corredor de apuestas, esta quizás no sea una suposición irrazonable, dado que ya demostré que, por lo menos para los mercados deportivos más grandes, las cuotas de apuestas de Pinnacle son muy eficientes. Es decir que, en promedio, reflejan con mucha precisión las probabilidades de resultados verdaderos subyacentes incluso si hay errores individuales. Quizás esto no sea tan cierto para los apostadores.

Distribución en la incertidumbre epistémica

Para modelar el efecto de la incertidumbre epistémica, he creado una serie de 1000 apuestas hipotéticas, donde la probabilidad verdadera de ganar cada apuesta es del 50 % Para cada apuesta, mi modelo de pronósticos hipotéticos exhibe algunos errores epistémicos en su valoración de esas probabilidades verdaderas de ganar, cuyo tamaño está determinado por seis desviaciones típicas diferentes: 0 %, 1 %, 2 %, 3 % 4 % y 5 %. Por ejemplo, para una desviación típica del 1 %, un poco más de dos tercios de las probabilidades “verdaderas” de ganar modeladas estarán entre el 49 % y el 51 %, con cerca del 95 % entre el 48 % y el 52 %.

Para las desviaciones típicas más grandes, el margen de estas probabilidades “verdaderas” de ganar producido por el modelo de pronósticos será mayor, como muestra el gráfico. Con una desviación típica del 0 %, todas las probabilidades de ganar serían del 50 % exactamente, por lo que no se muestra la línea. Mientras más amplia sea la distribución, más grande es la incertidumbre epistémica.

asymmetry-inarticle-Picture-1.jpg

Resulta evidente en el gráfico que, aunque cada una de estas distribuciones de probabilidades de ganar representan un modelo eficiente (el promedio es siempre del 50 %), la cantidad de incertidumbre epistémica es variable.

Invertir las probabilidades “verdaderas” de ganar nos da la distribución de las cuotas. Debido a la relación inversa entre la probabilidad de ganar y las cuotas implícitas, estarán distribuidas de forma lognormal.

En una muestra de 1000 apuestas, esto significa que las cuotas “verdaderas” modeladas por lo general variarán entre 1,88 y 2,13, 1,78 y 2,28, 1,69 y 2,46, 1,60 y 2,66, y 1,52 y 2,89 para las desviaciones típicas de 1 %, 2 %, 3 %, 4 % y 5 %, respectivamente.

asymmetry-inarticle-Picture-2.jpg

Corredor de apuestas vs. Apostador

Usemos este modelo de incertidumbre epistémica en las cuotas verdaderas para crear una competencia entre el corredor de apuestas y el apostador. Para cada apuesta, el corredor de apuestas publica lo que considera apuestas verdaderas con un margen del 2,5 % y reduce el precio. Por ejemplo, publicaría 1,95 si considerara que el precio verdadero es 2,00. Por encima de las 1000 apuestas, estas cuotas variarán según las distribuciones mencionadas.

El apostador tiene otro modelo y lo usa para calcular lo que considera que deberían ser las apuestas verdaderas. Si las cuotas publicadas del corredor de apuestas son más altas que el cálculo del apostador, el apostador realiza una apuesta de una unidad. De lo contrario, no hay apuesta.

Para definir las apuestas, las cuotas verdaderas de cada apuesta, desconocidas para el corredor de apuestas y para el apostador, son de 2,00 y se utiliza un generador de números aleatorios para determinar el resultado. Como explicamos antes, cada variación es la consecuencia de la incertidumbre aleatoria.

La competencia se repitió y se usó una simulación Monte Carlo 10 000 veces. Primero, observe la cantidad promedio de apuestas ganadas para cada uno de los 36 pares diferentes de incertidumbres epistémicas del corredor de apuestas y el apostador. Mientras más grande sea la incertidumbre epistémica (mostrada en los encabezados de filas y columnas), para el apostador o el corredor de apuestas, más probabilidad hay de que la diferencia entre los dos modelos sea mayor que el tamaño del margen; por lo tanto, más probabilidad hay de ganar una apuesta.

asymmetry-inarticle-Picture-3.jpg

Evidentemente, cuando el corredor de apuestas y el apostador son perfectos, es imposible que se realicen apuestas debido a que el corredor de apuestas siempre publicará 1,95 y el apostador siempre sabrá que debe realizar una apuesta más baja que el precio verdadero. 

En la segunda tabla vemos la rentabilidad promedio (prevista) que el apostador logró alcanzar para cada par de incertidumbres. Recuerde, mientras menor sea la desviación típica, menor será la incertidumbre epistémica y mejor será el modelo.

asymmetry-inarticle-Picture-4.jpg

Como es lógico, cuando el corredor de apuestas es perfecto y pronostica la probabilidad de cada apuesta con exactitud, no importará qué tan bueno sea el apostador, ya que perderá un monto equivalente al tamaño del margen (-2,5 %). La leve variación en torno a este número es meramente una consecuencia de la incertidumbre aleatoria. Una simulación Monte Carlo más grande reduciría esto.

También debemos tener en cuenta que si el modelo del apostador es mejor (con menos incertidumbre) que el del corredor de apuestas, esto es suficiente para generar una rentabilidad esperada. Sin embargo, también resulta evidente que hay algo bastante desconcertante. Cuando el modelo del corredor de apuestas es deficiente, el apostador puede conseguir una rentabilidad esperada incluso si su modelo es peor. Por ejemplo, si la incertidumbre epistémica del corredor de apuestas tiene una desviación típica del 3 % en la probabilidad de ganar, el apostador puede conseguir +0,68 % si su modelo tiene una desviación típica de incertidumbre del 5 %. Esto parece no tener sentido. 

La asimetría de las apuestas

Para resolver esta paradoja, debemos observar cómo se desarrolló esta competencia. En cuanto al mercado de apuestas, el corredor de apuestas fijará un precio. El apostador debe decidir si aceptará el desafío, y lo hará solo si las cuotas publicadas son superiores a sus propias cuotas “verdaderas” calculadas. Si eso sucede, el corredor de apuestas no tiene oportunidad de retirar la oferta de la apuesta.

En mi hipótesis, si hay una incertidumbre epistémica presente, el 50 % de los errores del corredor de apuestas pronosticará las cuotas “verdaderas” que son superiores a las cuotas verdaderas reales (de 2,00) y 50 % inferiores. De manera similar, el 50 % de los errores del apostador será superior o inferior a 2,00. 

Nunca podremos saber qué cree el corredor de apuestas que sean las cuotas “verdaderas”. Tampoco podemos saber cuáles son las cuotas verdaderas reales de esos cálculos.

Sin embargo, cuando las cuotas del corredor de apuestas son inferiores a 2,00, hay menos oportunidades de que las cuotas del apostador sean bajas, y se suscite así una apuesta. En cambio, hay más oportunidades de que una apuesta se suscite cuando las cuotas del corredor de apuestas son demasiado altas.

Esta asimetría genera una mayor proporción de apuestas de valor esperado positivo frente a valores negativos. Mientras más grande sea la incertidumbre epistémica, mayor será la asimetría. Cuando el corredor de apuestas y el apostador muestran una desviación típica del 2 % en la incertidumbre, el 56 % de las apuestas tiene un valor esperado positivo, y las apuestas de cuotas promedio son de 2,01. Cuando la desviación típica en la incertidumbre aumenta a 5 % para ambos, el 68 % de las apuestas gana con cuotas superiores a 2,00, con un promedio de 2,10. 

Si, en cambio, utilizamos un modelo diferente donde el comprador y el vendedor acuerdan mutuamente entrar en una apuesta con cuotas publicadas por un tercero, esta asimetría desaparece en gran medida. Ambos competirán contra el tercero y la incertidumbre epistémica de su modelo. Si la incertidumbre epistémica de ese tercero es pequeña, el comprador y el vendedor, si tienen modelos con la misma incertidumbre, perderán el equivalente del margen impuesto por el tercero. 

El mundo real de las apuestas

Todas estas conclusiones giran en torno a una suposición importante y probablemente poco realista. Se ha asumido que los modelos del corredor de apuestas y del apostador son completamente independientes entre sí. En realidad, es poco probable que esto suceda debido a que los modeladores suelen usar datos similares y algoritmos de pronósticos similares. 

Si el corredor de apuestas dedica mucho tiempo a la evaluación de las cuotas reales, es muy probable que el apostador haga lo mismo, y viceversa. Es posible que algunos apostadores también estén sujetos parcialmente al precio del corredor de apuestas.

Cualquier correlación de modelo entre el corredor de apuestas y el apostador reducirá el valor esperado del apostador y hará que sea más difícil que ganen.

Sin embargo, este modelo de incertidumbre epistémica ofrece una pista sobre qué tan bueno debe ser un corredor de apuestas típico para mantener la rentabilidad, incluso con un poco de margen a su favor. Dado que los corredores de apuestas no pueden retirar las cuotas una vez que el apostador las acepta, deben asegurarse de haber reducido su incertidumbre epistémica a un mínimo.

Nunca podremos saber qué cree el corredor de apuestas que sean las cuotas “verdaderas”. Tampoco podemos saber cuáles son las cuotas verdaderas reales de esos cálculos. Por lo tanto, no podemos determinar con precisión qué incertidumbre epistémica existe.

Sin embargo, podemos hacer una conjetura fundamentada si suponemos que las cuotas finales de un corredor de apuestas (sin el margen) representan las cuotas verdaderas reales. Luego, la diferencia entre las cuotas anteriores al cierre y las cuotas finales nos indicará cuántos errores hay en el modelo.

Si tomamos un conjunto de cuotas Más de/Menos de anteriores al cierre y cuotas finales de Pinnacle para los partidos de esta temporada de fútbol inglés, y eliminamos el margen y estandarizamos las cuotas finales en 2,00, la desviación típica en la probabilidad de ganar asumida por las cuotas antes del cierre es del 2 %. Esto está orientado al límite inferior de mis desviaciones típicas modeladas y revela nuevamente que el modelo de Pinnacle es muy efectivo en la minimización de la incertidumbre epistémica.

Para vencerlo, los apostadores deberán tener al menos la misma eficacia y tener a la asimetría de su lado. Si el error epistémico de Pinnacle en las competencias con una probabilidad de ganar del 50 % es solo del 2 %, no queda mucho espacio para la mejora por parte del apostador. Naturalmente, los apostadores pueden cambiar las cosas a su favor si aplican los umbrales de valor esperado mínimo antes de realizar apuestas contra Pinnacle. Pero, cualquier correlación que tenga el modelo dificultará la tarea.

Una vez más, demostramos que ganarle a un corredor de apuestas, y en particular a Pinnacle, no es nada fácil. Y ahora tenemos otro motivo por el cual sucede esto. Al igual que los vendedores de cuotas, no tienen el beneficio, como sus clientes, de elegir cuál podría ser una buena apuesta. Deben tomar riesgos en la línea y esperar haber acertado. Para Pinnacle, minimizar la incertidumbre epistémica y maximizar la eficiencia de las cuotas es lo fundamental.

Recursos para apostar: facultando sus apuestas

La sección Recursos para apostar de Pinnacle es una de las recopilaciones más exhaustivas de consejos expertos sobre apuestas que encontrará en Internet. Dirigida a todos los niveles de experiencia, nuestro objetivo consiste simplemente en facultar a los apostantes para que estén mejor informados.