ene. 24, 2023
ene. 24, 2023

Sorpresas y resultados inesperados: ¿Qué tan sorprendente fue la Copa del Mundo 2022?

¿Qué tan sorprendente fue la Copa del Mundo 2022?

Probabilidad de Monte Carlo

Underdogs en la Copa del Mundo 2022

Sorpresas y resultados inesperados: primera parte

Sorpresas y resultados inesperados: ¿Qué tan sorprendente fue la Copa del Mundo 2022?

¿Qué tan desconcertante fue la Copa del Mundo 2022? ¿Fue realmente una sorpresa que Japón le ganara a Alemania? Joseph Buchdahl procesa los datos para determinar si los resultados más inesperados en un torneo de tanta envergadura son tan sorprendentes como creemos.

De acuerdo con la compañía de metadatos deportivos Gracenote, la Copa del Mundo 2022 de Catar supuso toda una oportunidad para los underdogs, ya que 15 partidos terminaron con una resultado inesperado (tal como los habían definido). Se trata del porcentaje más elevado en 64 años.

La de Catar fue la Copa del Mundo más sorprendente en 64 años

No obstante, ¿qué tan sorprendente es esta cifra y cómo decidimos realmente lo que constituye un resultado inesperado?

Sí, probablemente todos pensemos que la victoria de Japón frente a España y Alemania, y la de Arabia Saudita frente a Argentina fueron lo que consideramos un resultado inesperado, pero esta premisa depende de la validez de nuestras creencias que indican que España, Alemania y Argentina deberían haber ganado esos partidos.

Nuestra intuición tal vez nos haga pensar que es obvio, pero cuando resulta imposible conocer perfectamente las probabilidades reales de un resultado, siempre debemos permanecer alertas ante la posibilidad de errores.

Cuando un resultado de fútbol parece sorprendente, ¿se debe a que el underdog (considerado como tal por un modelo predictivo preciso) tuvo suerte? ¿O se debe a que el underdog no era tal y el modelo predictivo era incorrecto?

Desde el punto de vista filosófico, este es un enigma interesante y bastante difícil de desentrañar. En este caso, estamos frente a dos tipos de incertidumbre.

La incertidumbre o el error en la validez del modelo de predicción recibe el nombre de «incertidumbre epistémica» y, teóricamente, se puede reducir mejorando los modelos.

El otro tipo de incertidumbre es intrínseca y se la conoce como «incertidumbre aleatoria» o, con mayor frecuencia, como «chance», «suerte» o «azar».

Esta incertidumbre es irreductible. Diferenciar la incertidumbre epistémica de la aleatoria puede resultar complicado. En estos dos artículos para Pinnacle, espero poner mi granito de arena para lograrlo. En este primer artículo, intentaré investigar el factor sorpresa de la Copa del Mundo en su conjunto.

En el segundo artículo, Uso de la Copa del Mundo para poner a prueba la eficiencia, me referiré más a lo que los hallazgos nos pueden decir sobre la precisión (o eficiencia) de las cuotas de un corredor de apuestas y la validez del modelo predictivo sobre el que se basan.

Probabilidades múltiples de 64 partidos

Si calculamos las probabilidades de cada uno de los tres posibles resultados de los 90 minutos de cada partido de la Copa del Mundo, podemos generar una probabilidad múltiple de 64 partidos para cada combinación posible de resultados. Pero ¿qué probabilidades de resultados debemos usar?

Sin lugar a dudas, los apostadores más ambiciosos tendrán sus propios métodos para hacer este cálculo, pero con el fin de ahorrar tiempo y sabiendo que se trata de algunas de las mejores probabilidades disponibles, usaré las probabilidades implícitas en las cuotas de apuesta de cierre de Pinnacle para los partidos.

En varias ocasiones, he analizado en detalle por qué las cuotas de cierre de Pinnacle son algunas de las mejores disponibles para calcular los verdaderos resultados de la probabilidad.

Obviamente, como Pinnacle le agrega un margen a esas cuotas, primero debo eliminarlo. Tengo mi propia calculadora para lograrlo.

Después, podemos usar estas probabilidades múltiples para intentar responder la pregunta: ¿qué tan sorprendentes fueron los resultados de la Copa del Mundo 2022 de forma colectiva?

Falacia narrativa

Vale la pena tomarse un momento para comprender que la probabilidad de que no existan resultados inesperados en ninguno de los 64 partidos de la Copa del Mundo es extremadamente pequeña.

Hay un 11 % de probabilidades de que todos los favoritos ganen

Con las cuotas de cierre de Pinnacle, he calculado que esto equivale a 6,5 x 10-17, o un poco más de 1 millón de billones, para los resultados luego de 90 minutos.

Si esto hubiese ocurrido, habría sido uno de los acontecimientos más asombrosos en la historia de la humanidad.

No obstante, me pregunto si muchas personas (descontando a los expertos en estadística) habrían prestado mucha atención a este hecho, más allá de destacar que esto era la demostración de que se estaba celebrando una Copa del Mundo muy aburrida.

Las demás probabilidades múltiples de los 64 partidos (que son muchísimas, tres elevado a la potencia 64 o, para ser más precisos, 3 433 683 820 292 512 484 657 849 089 281) tienen una menor probabilidad.

Cada una de ellas incluirá resultados inesperados (si los definimos como un resultado diferente del favorito) y cuanto más pequeña sea la probabilidad múltiple, mayor será el número de resultados inesperados.

Sin embargo, existe una sola manera de que no haya resultados inesperados: deben darse todos los resultados favoritos. Por el contrario, los resultados inesperados pueden ocurrir de muchas maneras. Individualmente, su probabilidad múltiple en 64 partidos puede ser más pequeña, pero, en conjunto, hay más probabilidades de que ocurran que de que no ocurran.

Consideremos un simple ejemplo de binomio de 10 partidos con dos posibles resultados, en los que cada favorito tiene una probabilidad de ganar del 80 % y cada underdog, una probabilidad del 20 %.

Las chances de que todos los favoritos ganen son del 11 %, pero las de que ganen tres underdogs son del 20 % e incluso hay un 9 % de chances de que ganen cuatro underdogs.

¿Por qué son tan elevadas las cifras? Individualmente, las probabilidades son de solo 0,17 % y 0,04 % (para cualquier conjunto determinado de tres o cuatro underdogs respectivamente), pero pueden ocurrir de muchas formas: 120 para tres underdogs y 210 para cuatro de ellos.

Esta no es sino otra manera de decir que debemos esperar que ocurran resultados inesperados. Aun así, con demasiada frecuencia, nuestros cerebros están preparados para crear historias simples (y a veces erradas) a partir de los datos, con el fin de darle sentido a un mundo que considera que los resultados inesperados son más inesperados de lo que realmente son.

Cuando Japón no le gana a España y Alemania, no escribimos historias; pero las estadísticas nos dicen que estos resultados sorprendentes son, efectivamente, una certeza estadística. Este es un ejemplo de una falacia narrativa.

Una distribución de probabilidad de Monte Carlo

Hay solo una forma de ver una probabilidad múltiple de 64 partidos con una probabilidad de 6,5 x 10-17. La probabilidad múltiple menos probable, en la que ganan todos los underdogs, surge con 1,5 x 10-51 y además hay solo una forma de que esto ocurra. Pero ¿de cuántas maneras podríamos ver probabilidades múltiples de, por ejemplo, 10-25 o 10-30?

Manipular este tipo de cálculos con algoritmos es demasiado complejo. Para simplificar las cosas, es una buena idea recurrir a una simulación de Monte Carlo.

Aleatorizando los resultados de los partidos de acuerdo con las probabilidades implícitas definidas por Pinnacle, podemos crear una probabilidad múltiple de 64 partidos generada aleatoriamente.

Repita esto gran cantidad de veces, cuente cuántas de cada una de las probabilidades definidas ocurren y podremos definir la distribución de la probabilidad probable. Es decir, que podemos definir el rango y la probabilidad de los resultados posibles de los 64 partidos de la Copa el Mundo.

Sin embargo, manejar valores de probabilidad pequeños es, intuitivamente, bastante difícil. No obstante, podemos aplicar una leve transformación para que esto sea cognitivamente más manejable: calcular su logaritmo.

Por ejemplo, el logaritmo (base 10) de 0,001 es -3; de 0,000001 es -6, y de 0.000000000001 es -12. De hecho, utilizaré el logaritmo natural (ln) para mis fines (base e) y quitaré el signo negativo.

Mi simulación de Monte Carlo contenía 100 000 secuencias, para 100 000 valores del logaritmo natural de cada probabilidad múltiple de 64 partidos aleatorizados (sin el signo negativo).

Luego de agruparlas, las ubiqué en el siguiente gráfico de distribución de frecuencia (o probabilidad).

Shock-WC.png
El rango completo del eje X es de 37,3 (para la victoria de los 64 favoritos) a 117,1 (para la victoria de todos los underdogs), pero, como sabemos, sus probabilidades son increíblemente bajas.

De hecho, solo es necesario mostrar los resultados más probables para tener una idea de cuál es el rango de posibilidades. Si miramos el gráfico, podemos ver que es muy probable que una probabilidad múltiple de 64 partidos tenga un valor de entre 45 y 75 en el eje x.

Esto corresponde a probabilidades múltiples de 3 x 10-20 y 3 x 10-33 respectivamente.

La probabilidad múltiple disminuye a medida que nos movemos por el eje x hacia la derecha. El resultado múltiple promedio, u observado con más probabilidad, tiene una cifra de aproximadamente 60 en el eje x, lo cual corresponde a una probabilidad múltiple de 7,5 x 10-27.

En el gráfico también se muestra, por medio de la línea vertical negra, la ubicación del resultado múltiple real que se observó en la Copa del Mundo. Tiene un valor de 63,5 en el eje X (y una probabilidad múltiple de 2,7 x 10-28).

Esto es prácticamente 28 veces menos que el más probable de los resultados múltiples.

Esto parece mucho, pero el gráfico nos muestra otra realidad. Podemos ver que no está tan alejado del centro (el promedio) de la distribución de la probabilidad. De hecho, aproximadamente el 20 % de las posibles probabilidades múltiples de la Copa del Mundo eran más pequeñas que la que realmente ocurrió.

Desde el punto de vista estadístico, no llamaríamos a esto una sorpresa. Para eso, necesitaríamos que la línea vertical se moviera al menos hasta 70 en el eje x, lo cual significaría que menos del 1 % de las opciones múltiples posibles eran menos probables. Esto correspondería a una probabilidad múltiple de aproximadamente 4 x 10-31 o casi 700 veces más pequeña que la que ocurrió.

Para eso, tendríamos que haber visto algo como Catar derrotando a Países Bajos, Polonia derrotando a Francia y Corea del Sur derrotando a Brasil.

¿Fue esta una Copa del Mundo sorprendente?

A partir de los datos que he presentado en este artículo, estamos en posición de responder a mi pregunta inicial.

No, no fue tan sorprendente. Sí, hubo resultados inesperados sorprendentes en partidos individuales, pero ahora sabemos que esto es esperable en torneos con muchos partidos. De hecho, habría sido mucho más sorprendente que no hubiese habido ningún resultado inesperado.

Pero ¿qué significa realmente sorprendente desde el punto de vista filosófico? Esto depende considerablemente de las expectativas iniciales del resultado del partido.

A modo de ejemplo exagerado, mi modelo de predicción convirtió a Gales en el principal favorito para derrotar a Inglaterra, a Ghana en el favorito para vencer a Portugal, a Australia en el favorito para vencer a Francia, a Costa Rica en el favorito para vencer a Alemania, y así en adelante con los 64 partidos.

Posiblemente, quedaría muy sorprendido por los resultados. ¿Esto se debe a que los underdogs, según mi modelo, tuvieron suerte? ¿O se debe a que mi modelo de predicción era incorrecto?

En este caso resulta bastante obvio, pero con mayor frecuencia la diferencia entre estas dos opciones es mucho más sutil.

Los cálculos de Pinnacle para las probabilidades de los partidos no captaron a la perfección lo que ocurrió. ¿Esto se debe a la mala suerte o a un error en el modelo?

En este caso, es mucho más difícil de responder. No obstante, dado que no existe una diferencia estadísticamente significativa entre las expectativas de Pinnacle y los acontecimientos del mundo real, podemos decir con fundamento que el modelo predictivo de Pinnacle no es tan malo.

En otras palabras, la Copa del Mundo (de acuerdo con la opinión de Pinnacle) no fue particularmente sorprendente en términos estadísticos. Fue menos probable que el resultado más probable de la Copa del Mundo (que tal vez habría contado con dos o tres resultados inesperados menos en los partidos), pero no hubo una gran diferencia.

Si la diferencia hubiese sido estadísticamente significativa, habría sido más fácil refutar la opinión de Pinnacle.

Por lo tanto, podríamos formular una regla: cuanto mayor es la diferencia entre la expectativa y la realidad, mayor es la probabilidad de que nuestro modelo de expectativas sea incorrecto. ¿Cuál es la diferencia entre el modelo predictivo de partidos de la Copa del Mundo de Pinnacle y el modelo de otras casas de apuestas? Este es el tema de la segunda parte de esta serie de artículos.

Regístrese en Pinnacle para acceder a grandes cuotas de fútbol en una amplia variedad de mercados. Asegúrese de leer otros artículos de interés de Joseph Buchdahl en Recursos de apuesta.

Recursos para apostar: facultando sus apuestas

La sección Recursos para apostar de Pinnacle es una de las recopilaciones más exhaustivas de consejos expertos sobre apuestas que encontrará en Internet. Dirigida a todos los niveles de experiencia, nuestro objetivo consiste simplemente en facultar a los apostantes para que estén mejor informados.