jun. 16, 2023
jun. 16, 2023

¿Es posible utilizar el parámetro «goles esperados» (xG) para pronosticar partidos de fútbol y conseguir ganancias en las apuestas?

Comprensión de los goles esperados

Utilizar los xG para pronosticar resultados en el fútbol

Análisis del modelo Dixon-Coles

¿Es posible utilizar el parámetro «goles esperados» (xG) para pronosticar partidos de fútbol y conseguir ganancias en las apuestas?

La estadística de goles esperados es una herramienta de pronósticos muy conocida. ¿Los apostadores pueden utilizar los goles esperados para determinar un resultado acertado? El analista de apuestas Joseph Buchdahl examina los datos y determina si los goles esperados pueden pronosticar resultados en el fútbol.

Las apuestas deportivas, por lo menos para las personas que pretenden tratarlas como algo más que un pasatiempo ocasional, están relacionadas desde hace mucho tiempo con el concepto de expectativa y, en particular, con la idea de valor esperado.

Las apuestas se ganan y se pierden, pero lo que sucede es en gran parte producto de la suerte.

Sin embargo, a la larga, conocer el valor esperado permite a un apostador estimar qué puede esperar ganar en una muestra más amplia de apuestas. «Esperado» es solo otra forma de decir «media aritmética» o «promedio».

Más recientemente, el concepto de expectativa encontró su camino en el fútbol por medio de la noción de goles esperados (o xG). Los goles esperados se utilizan como métrica de desempeño para evaluar la actuación de los equipos y los jugadores de fútbol mediante la asignación de una probabilidad a una oportunidad de anotación que pueda convertirse en un gol.

Se calcula a partir de datos históricos de oportunidades similares y de la tasa de conversión de los goles. Por lo tanto, los xG para una oportunidad de anotar goles se situarán entre 1 y 0.

Además, la suma de los xG en un partido con cierto número de oportunidades de anotar un gol dará como resultado los xG del partido propiamente dicho o, lo que es lo mismo, los xG de cada equipo en un partido.

Los xG son una representación más real de la calidad del juego de los equipos en un partido.

En teoría, los xG representan mejor que los goles reales la calidad del juego de los equipos en un partido, así como la superioridad de un equipo frente a otro.

Los goles se anotan con un cierto grado de suerte (lo que los estadistas denominan «ruido»), de modo que utilizar un marcador real para pronosticar lo que un equipo puede llegar a hacer en su próximo partido sería menos confiable que utilizar sus xG.

De algún modo, los goles son como las ganancias y las pérdidas en las apuestas, en tanto que los goles esperados son como el valor esperado. Si este es el caso, ¿podemos utilizar los xG en lugar de los goles para pronosticar el resultado de los partidos de fútbol y obtener ganancias en las apuestas?

Goles frente a xG

El matemático y autor de Soccermatics: Mathematical Adventures in the Beautiful Game, David Sumpter, ofrece algunas pautas sobre la utilidad relativa de los goles frente a los xG cuando se pretende pronosticar el resultado de partidos en el futuro. Sumpter resume de forma precisa la dificultad de encontrar una señal de pronóstico a partir de los datos de los goles.

«Las estadísticas dicen que el resultado de un partido de fútbol tiene casi tanto de ruido como de señal. La explicación matemática de esto la encontramos directamente en la distribución de Poisson. Los goles en el fútbol tienen una distribución de Poisson y los equipos anotan aproximadamente 1,40 goles en promedio. La variación y la media son iguales en la distribución de Poisson. Por lo tanto, la desviación estándar es la raíz cuadrada de 1,40, es decir, 1,18. De esta forma, el ruido (1,18) es ligeramente menor que la señal (1,40)».

Los xG, por el contrario, son una medición de las oportunidades creadas y, en consecuencia, ofrecen una mejor expresión de la calidad de un equipo durante un mismo partido que los goles.

Normalmente, tienen menos ruido y más señal. Para los goles y para los xG, la cantidad de ruido en los resultados de los partidos disminuye según aumenta el número de partidos que se estudian. Sin embargo, la tasa de disminución es en un principio más marcada para los xG que para los goles.

Sumpter utiliza esta información para recomendar en qué clase de datos debemos concentrarnos cuando tratamos de hacer pronósticos de partidos en el futuro. Para uno o dos partidos, es el informe del mismo partido el que ofrece la información más útil.

Por otro lado, para muestras de más de 15 partidos o de la mejor parte de la mitad de una temporada, los datos de los goles serán potencialmente tan confiables como los xG.

El ruido aún será un poco mayor, pero la diferencia es mínima. Además, los goles representan la realidad, lo que ocurrió, a diferencia de los xG, que son un modelo probabilístico de las posibilidades de anotar un gol. Si es inexacto, puede resultar menos confiable que los datos sobre los goles.

Entre estos extremos existe un área muy interesante desde el punto de vista del uso de los xG como herramienta de pronóstico. Sumpter afirma que el informe sobre los xG puede resultar más útil entre los tres y los seis partidos, en tanto que entre los siete y los 15 partidos podría convenir más una comparación entre los goles y los xG.

Para este artículo, elaboré un modelo de pronósticos de los xG a partir de los seis partidos más recientes jugados por un equipo y evalué la posibilidad de utilizarlo para obtener ganancias en las apuestas.

Modelo Dixon-Coles

El enfoque mejor documentado para pronosticar partidos de fútbol es el que publicaron Mark Dixon y Stuart Coles (de la Universidad de Lancaster) en el Journal of Applied Statistics en 1997.

Como es sabido, el modelo Dixon-Coles desarrolla el concepto de la fuerza ofensiva y defensiva y compara los goles individuales anotados y recibidos por cada equipo con los promedios de la liga a lo largo de una determinada cantidad de partidos jugados con anterioridad.

Esta información se utiliza para estimar el número de goles esperados que meterá cada equipo en su próximo partido.

Por último, la distribución de Poisson sirve para calcular las probabilidades de anotar goles individuales, en las que el número de goles esperados es la media de la distribución. Pinnacle tiene un artículo previo con la descripción de la metodología.

En este caso, adapté el modelo para utilizar los xG en lugar de los goles, y calculé los puntos fuertes ofensivos y defensivos a partir de los seis partidos más recientes jugados como local o visitante. Mi conjunto de datos incluyó partidos jugados en las divisiones Premier de Inglaterra, Francia, Alemania, Italia y España durante las temporadas 2015/16 a 2019/20.

Las probabilidades pronosticadas para los resultados de local, empate y visitante se convirtieron en cuotas de apuestas justas implícitas y, posteriormente, se compararon con los precios de cierre de Pinnacle.

Cuando estos últimos eran más amplios, representaban el valor teórico del modelo de pronósticos. Entonces, se compararon las apuestas de valor con los resultados.

La gráfica que aparece a continuación muestra la serie de tiempo de ganancias de las 7795 oportunidades de apuestas de valor identificadas por el modelo, de un total posible de 18 006. La ganancia del importe de la apuesta plana sobre el volumen de negocio fue del -5,0 %. Este dato se compara con una pérdida del -4,3 % en caso de que cada resultado de 18 006 se hubiese apostado a ciegas al importe de una sola unidad de apuesta. Dado que el valor esperado promedio de esta muestra fue del 38,9 %, decir que es un logro insuficiente sería quedarse muy corto.

colesdixon1.png

Invalidez potencial del modelo

Quizá la primera pista para el fracaso de este modelo se deba al valor esperado promedio en sí.

Con unas cuotas promedio de 4,69, una cifra cercana al 40 % para el valor esperado promedio de apuestas que representan más de un tercio de todas las oportunidades posibles indicaría firmemente una variación considerable en las cuotas de apuestas justas implícitas en comparación con los precios reales de Pinnacle.

Una gráfica de correlación entre los valores de los xG pronosticados por el modelo y los valores de los xG reales que se registren para el partido pronosticado confirma esta tesis.

colesdixon.png

Hay mucho ruido; los xG calculados no hacen un trabajo especialmente bueno a la hora de pronosticar con exactitud los xG reales de un equipo en un partido.

El origen del fracaso del modelo puede ser más difícil de descubrir, puesto que existen como mínimo cuatro problemas potenciales. En primer lugar, el uso de un modelo de Dixon-Coles para pronosticar resultados de fútbol puede ser imperfecto por naturaleza. La distribución de Poisson en la que se basa implica que la anotación de goles es independiente, es decir, que un gol no origina la anotación de otro.

Sin embargo, esta hipótesis ignora la influencia de la psicología de los jugadores y del equipo. Los equipos que quedan en desventaja pueden estar más motivados de lo que estaban anteriormente para equilibrar la balanza, mientras que los equipos que empatan pueden sentirse más motivados para avanzar.

En ese caso, la idea de que los goles se anotan al azar debe cuestionarse sin lugar a dudas.

Según indicaron los propios Dixon y Coles, en su modelo de pronóstico original se subestimaban los resultados de los puntajes bajos (0-0, 1-0, 0-1 y 1-1). Para confirmar este hallazgo, volví a ordenar por separado los datos de los xG pronosticados en mi modelo y los datos de los xG reales del partido, de menor a mayor, y los grafiqué como una correlación artificial a continuación (línea continua).

Claramente, hay menos xG bajos reales de los que pronostica mi modelo, mientras que hay más xG altos de los que debería haber (la línea discontinua).

Lo que Dixon y Coles descubrieron con respecto a los goles también parece ser válido para los xG, un hallazgo que no resulta del todo sorprendente si se tiene en cuenta que los goles y los xG en los partidos se correlacionan perfectamente en muestras de datos de tamaños considerables.

colesdixon3.png

La segunda posible fuente de error es el propio modelo de los xG. Para mi muestra de datos, el total de los xG fue del 97,8 % de los goles reales anotados en los partidos. A pesar de que parece una buena coincidencia, es difícil saber si esta diferencia podría bastar para afectar a la validez de un modelo de pronósticos de los xG.

La tercera fuente de error podría deberse a mi elección del número de partidos recientes utilizados para calcular las fuerzas ofensivas y defensivas de Dixon-Coles.

De acuerdo con las razones que expuse anteriormente en el artículo, elegí seis partidos. Es posible que una cifra diferente, más alta o más baja, hubiera funcionado mejor.

Ese cambio sería relativamente fácil de realizar, aunque necesitaría una ejecución completa del modelo y eso no lo haré aquí.

Por otra parte, los seis partidos recibieron la misma ponderación. Dixon y Coles reconocieron que los partidos más recientes quizá deberían tener un mayor peso a la hora de calcular las fortalezas promedio, por lo que introdujeron esa ponderación en versiones posteriores de su modelo.

Repito, es una característica que pude haber modificado por mi cuenta, pero por el tiempo que requiere el proceso, opté por no hacerlo.

Hay un último problema, y posiblemente el más importante, con mi modelo a la hora de intentar obtener ganancias con los pronósticos de partidos de fútbol.

Sin considerar todas las demás fuentes posibles de errores, incluso un buen modelo de los xG, que sea mucho mejor de lo que es el mío, puede ser incapaz de obtener unas ganancias no aleatorias por no ser tan adecuado como lo es el modelo que utiliza la casa de apuestas para elaborar sus cuotas.

Como el modelo Dixon-Coles está muy documentado y los xG actualmente son una métrica muy utilizada, es posible que toda la información que ofrece un pronóstico de este tipo ya esté incluida en las cuotas de las casas de apuestas.

Una competencia de habilidades relativas

La apuesta deportiva es muy parecida a los deportes competitivos en los que se basa. Es una competencia de habilidades relativas entre dos o más contendientes, que se enfrentan para ver quién es el mejor en pronosticar el futuro.

Mientras mejor sea el pronosticador, más confiable y válida será su evaluación de las probabilidades reales de los resultados (y, por lo tanto, de las cuotas de las apuestas). Los errores se castigan con penalizaciones económicas.

Pinnacle, con total probabilidad la casa de apuestas basada en el análisis de datos que más destaca en el mercado, tendrá modelos de pronóstico excepcionalmente seguros, mucho mejores que los míos. Sabemos que Pinnacle tiene clientes que pueden generar ganancias no aleatorias, pero ya comenté previamente lo poco comunes que pueden ser.

Si Pinnacle representa el Aston Villa de los modelos de pronósticos, estos astutos clientes son más bien el Liverpool y el Manchester City.

Por supuesto, es posible que usted tenga un buen modelo, tal vez un Reading o un Derby, lo bastante bueno como para hacer pronósticos aceptables, pero no lo suficiente como para superar a los mejores modelos. Es probable que mi modelo aquí ni siquiera se clasificara para la Isthmian League.
Los xG también ofrecen un recurso útil para desarrollar un modelo de pronósticos.

En lo que respecta a la posibilidad de utilizar eficazmente los xG para ganar dinero en un mercado de apuestas de fútbol, hay que plantearse lo siguiente. Las cuotas que un modelo de pronósticos ofrece son un reflejo de la calidad de la información que contiene.

Los xG quizá ofrezcan un recurso de datos útil para desarrollar un modelo de pronósticos, pero si Pinnacle ya incorpora esa información en su propio modelo, así como cualquier otra información útil que yo no tenga, mi modelo de pronósticos no va a superar el suyo.

Cualquier información que aporten mis datos sobre los xG ya está incluida en sus cuotas. Se trata del Canvey Island F.C. frente al Aston Villa.

Si Pinnacle (e incluso otras casas de apuestas) ya utilizan los xG en sus modelos de pronósticos y de establecimiento de cuotas, algo muy probable debido al tiempo que llevan disponibles los datos, resulta incierto que el uso que yo haga de estos datos mejore lo que ya se lleva a cabo.

Entonces, ¿pueden los datos de los xG hacerme obtener ganancias con las apuestas de fútbol? La respuesta dependerá, como en cualquier otra forma de análisis de datos para las apuestas, del modo en que se utilicen. Y la forma en que usted los utilice tendrá que ser mejor que la forma en que las casas de apuestas lo hacen actualmente. Puede mantenerse al día del extraordinario trabajo de Joe a través de su cuenta de Twitter aquí o en nuestra página de Recursos de apuesta aquí

Las cuotas están sujetas a cambios

Recursos para apostar: facultando sus apuestas

La sección Recursos para apostar de Pinnacle es una de las recopilaciones más exhaustivas de consejos expertos sobre apuestas que encontrará en Internet. Dirigida a todos los niveles de experiencia, nuestro objetivo consiste simplemente en facultar a los apostantes para que estén mejor informados.