mai 13, 2020
mai 13, 2020

Outra perspectiva da aleatoriedade e eficácia nas apostas de futebol

O que é eficiência?

Entenda aleatoriedade e eficiência

Ainda há mais a aprender

Outra perspectiva da aleatoriedade e eficácia nas apostas de futebol

Joseph Buchdahl publicou vários materiais educativos sobre como medir a aleatoriedade nas apostas de futebol e como são as probabilidades eficientes e por que elas são tão difíceis de superar. Em seu artigo mais recente, Buchdahl abordou esse assunto mais uma vez para reexaminar a aleatoriedade e eficiência nas apostas de futebol.

Imagino que os leitores provavelmente estejam cansados de ouvir que apostar em partidas de futebol é uma tarefa difícil porque, em grande parte, é aleatória e eficiente. Essa também costumava ser a minha opinião, mas nesse momento de isolamento social e suspensão dos eventos de futebol, sem muito o que fazer a não ser procrastinar a escrita de outro livro, comecei a revisitar algumas velhas ideias.

Este artigo é o fruto desse trabalho. Não há nada novo, apenas a representação dessas ideias sob uma perspectiva diferente. Espero que seja útil para você.

O que é eficiência?

Ao longo dos anos, conversei com pessoas que me disseram que o futebol não é aleatório. Como pode ser aleatório quando o Manchester United tem muito mais probabilidade de derrotar o Cambridge United? Eles têm razão, mas não estamos falando sobre futebol, estamos falando sobre apostas de futebol.

Basicamente, as probabilidades apresentam uma desvantagem quando se trata de levar em conta a habilidade diferencial das equipes. Melhores equipes têm probabilidades menores. Assim que um número suficiente de pessoas usa seu dinheiro para opinar sobre as chances de uma equipe vencer, as probabilidades tendem a refletir melhor quais seriam as probabilidades "reais", como se pudéssemos sabê-las, por meio de um processo conhecido como descoberta de preços. Não importa se isso acontece pela sabedoria do povo ou dos espertos.

Tentar bater as probabilidades da Pinnacle, pelo menos no futebol da liga inglesa, não é algo recomendado para quem tem o coração fraco.

O trabalho das casas de apostas é chegar o mais próximo possível das probabilidades reais para garantir que elas enfrentem o menor risco possível na obtenção da comissão de criação do mercado a longo prazo. O trabalho do apostador é encontrar os erros das casas de apostas.

Para verificar se a casa de apostas está chegando perto, em média, das probabilidades reais, podemos verificar se, ao apostar em todas as probabilidades, chegaríamos a um empate antes de aplicar as margens da casa. Além disso, se a variabilidade nos retornos de pequenas amostras de apostas se distribuir da mesma forma como se estivéssemos jogando moedas, e se esses retornos regredirem para a média, esses são outros sinais de que as probabilidades das casas de apostas são eficientes e a variação de desempenho é apenas ruído, e não um sinal.

Vejamos alguns dados. Nas últimas três temporadas (2016/17 a 2018/19) da liga profissional de futebol inglês, usei as probabilidades de encerramento da Pinnacle com a margem removida (as probabilidades "justas") para calcular a pontuação de uma equipe em cada partida. Essa regra simples de pontuação, que já usei antes, funciona da seguinte forma:

Se uma equipe vencer, dê um ponto de 1 – 1/probabilidades

Se uma equipe não vencer, dê um ponto de –1/probabilidades

Assim, as pontuações da equipe para partidas individuais serão entre a máxima e a mínima teórica de +1 e -1, respectivamente.

Para as quatro divisões ao longo das três temporadas (6.108 partidas e 12.216 pontuações), a pontuação média foi de 0,0030 com um desvio padrão de 0,4557. Isso se aproxima bastante de uma pontuação média esperada de 0 se as probabilidades justas, em média, forem perfeitas.

Uma distribuição de pontuações aleatórias?

E a distribuição de amostras de pontuação? Com os dados organizados por equipe e data do jogo, calculei uma série de pontuações de seis partidas em média para cada equipe. Obviamente, não há pontuação para as cinco primeiras partidas de uma temporada.

A média de seis jogos foi de 0,0032 com desvio padrão de 0,1866. Sua distribuição é mostrada pela linha azul no gráfico abaixo. A linha laranja mostra a distribuição teórica normal das pontuações, como se tivessem sido geradas aleatoriamente. Trata-se de identificar a diferença entre ela e a distribuição das pontuações com base nos resultados reais.

Randomness-in-soccer-betting-InArticle-1.jpg

Além disso, o desvio padrão é quase exatamente o mesmo previsto a partir dos primeiros princípios usando o erro padrão da média,

Randomness-in-soccer-betting-InArticle-4.jpg

onde "σ" é o desvio padrão nas pontuações de toda a população de partidas individuais e "n" é o tamanho da amostra, neste caso 6.

Randomness-in-soccer-betting-InArticle-5.jpg

Isso é significativamente diferente do número observado de 0,1866. Podemos usar a fórmula de erro padrão novamente para calcular o desvio padrão esperado neste valor de erro padrão, ou seja, o erro padrão do erro padrão. Sabendo que há 10.836 amostras de 6 jogos, o cálculo será realizado da seguinte forma.

Randomness-in-soccer-betting-InArticle-6.jpg

Assim, 0,1860 é apenas um terço de um desvio padrão diferente de 0,1866, e se encontra bem dentro dos limites da significância estatística. A diferença entre observação e aleatoriedade esperada surgiu apenas por causa do acaso.

A implicação é que as probabilidades de Pinnacle fornecem uma excelente medida da verdade e que a grande maioria dos retornos que os apostadores terão apostando nelas, ao longo de seis partidas, pelo menos, será simplesmente uma questão de sorte.

Essa é uma mensagem muito desagradável e sou criticado por ela o tempo todo. A crítica principal foca a frase "em média". As probabilidades da Pinnacle para o futebol podem ser eficientes em média, mas os apostadores não estão apostando em média. Isso é verdade, mas a parte difícil para o apostador está em saber como encontrar os erros específicos da casa de apostas, sistematicamente. As evidências sugerem que a grande maioria os está "encontrando" aleatoriamente.

Repeti o exercício para amostras de 12 e 24 jogos. Suas distribuições de pontuação são mostradas juntas abaixo. Elas seguem as distribuições normais geradas aleatoriamente ainda mais de perto do que para as pontuações de seis jogos.

Randomness-in-soccer-betting-InArticle-2.jpg

As pontuações médias de 12 e 24 jogos foram de 0,0037 e 0,0049, respectivamente (as pequenas diferenças entre os três são provavelmente causadas pelo acaso e populações de diferentes tamanhos de partidas contribuintes). Os desvios padrão foram 0,1301 e 0,0916, respectivamente, em comparação com 0,1315 e 0,0930 calculados utilizando o erro padrão da média. Essas diferenças de expectativa são cada uma cerca de 1 desvio padrão, novamente sugerindo que eles aconteceram por acaso e nada mais.

Regressão à média

Se os desvios em pontuações médias de seis jogos foram sistemáticos, então pode ser que você consiga prever o que aconteceria. Por exemplo, podemos prever que equipes com boa forma ao longo de seis jogos com uma média positiva de pontuação mostrarão outra média positiva nos próximos seis jogos. Infelizmente, não é o caso. Há uma regressão quase perfeita para a média de amostras de seis jogos.

Observe que não estou argumentando que equipes mais fortes ao longo de seis jogos tendem a se tornar menos fortes nos próximos seis jogos. Pelo contrário, equipes mais fortes tendem a permanecer mais fortes. Veja o caso do Liverpool nessa temporada. Estou argumentando que as recompensas de pontuação que recebem por isso, que são deficientes em um mercado de apostas que leve em conta suas habilidades subjacentes, são uma regressão média.

O gráfico abaixo mostra que é praticamente impossível, em média, prever a média de seis jogos que uma equipe terá nos jogos 7 a 12 com base em sua pontuação nos jogos 1 a 6. Pode haver séries de vitórias para times de futebol, mas não para apostadores que apostam em recompensas deficientes.

Randomness-in-soccer-betting-InArticle-3.jpg

A habilidade das casas de apostas em definir probabilidades, e a habilidade dos apostadores em explorar quaisquer erros se eles existem significa que, ao fechar o mercado, quase toda a variação que você vê nas pontuações de apostas é o resultado da incerteza aleatória: o acaso.

Uma regra de pontuação?

Mês passado, discuti o uso da pontuação de probabilidade de classificação (RPS) como regra de pontuação para ajudar a medir a eficiência do mercado de apostas de futebol da Pinnacle. Poderíamos pensar na regra de pontuação que usei neste artigo de forma semelhante.

Se as probabilidades da Pinnacle fossem perfeitamente eficientes, a pontuação média da população seria exatamente 0. Claro que, quanto ao RPS, nunca saberemos quanto do desvio de 0 é resultado da incerteza aleatória (aleatoriedade nos resultados) e quanto é resultado da incerteza epistêmica (erro no modelo de definição de probabilidade da casa de apostas). Eu potencialmente introduzi um erro epistêmico secundário na maneira como removi a margem das probabilidades da Pinnacle. Como não sei exatamente como eles a aplicam, foi preciso estimar como removê-la.

No entanto, a proximidade com que a pontuação média da população se aproxima de 0 e a proximidade com que as distribuições das pontuações médias da amostra de partidas se aproximam de uma distribuição aleatória é uma forte evidência da eficiência das probabilidades da Pinnacle para apostas em jogos de futebol.

E a falácia da mão quente?

Toda essa discussão traz um grande problema. Há dois anos, apresentei um sistema de apostas que tentou explorar a ineficiência nas probabilidades da Pinnacle para partidas de futebol que podem surgir como resultado da falácia da mão quente.

A hipótese era que os apostadores podem acreditar em faixas de ganhos. Consequentemente, eles podem apostar mais em equipes com sequência de vitórias, reduzindo suas probabilidades em relação às probabilidades de resultado reais. Em contrapartida, equipes em baixa não receberiam tantas apostas, aumentando suas probabilidades e potencialmente criando oportunidades de valor.

A diferença entre as apostas em equipes relativamente "em baixa" em relação a equipes relativamente "em alta" ao longo da sequência de 6 partidas foi pouco significativa (p-value = 0,02 para a população da partida analisada). Essa diferença foi muito maior entre as equipes "em baixa" em relação às equipes "em alta" (p-value = 0,001) e um lucro real de 2,7% de uma amostra de mais de 5.000 apostas (probabilidades médias de 3,9) poderia ter sido gerado a partir das probabilidades de encerramento da Pinnacle. Mas, se esta análise apresenta o mercado como quase perfeitamente eficiente, isso tudo foi apenas uma ilusão de sorte?

O trabalho da casa de apostas é chegar o mais perto possível das verdadeiras probabilidades… O trabalho do apostador é encontrar os erros das casas de apostas.

Isso é possível. Esse lucro de 2,7% poderia acontecer 7 em 100 vezes por acaso, por isso é dificilmente garantido em um sentido estatístico. No entanto, se olhar de perto a distribuição de médias de pontuação de 6 jogos novamente, você verá que há menos pontuações negativas significativas do que seria esperado por acaso. 438 delas são inferiores a -0,3, em comparação com 563 para resultados gerados aleatoriamente.

Uma possível explicação para isso é que com apostas em equipes com sequência de derrotas, as probabilidades aumentam mais do que deveriam, o que significa que, cada vez que perdem, elas obtêm um resultado negativo relativamente menor. Se tivesse apostado naquelas 438 equipes com uma pontuação média de 6 jogos inferior a -0,30 em seu 7ºjogo, você teria tido um lucro de 11,6% (probabilidades média de 3,22, p-value = 0,06).

Na verdade, apenas 438 pontuações abaixo de -0,3 foi um resultado bastante sortudo. Com essas probabilidades, a randomização dos resultados com base em suas probabilidades implícitas revelou um número esperado de 513, com apenas 2,5% mostrando menos de 438 em uma simulação de Monte Carlo. Podemos então comparar este número esperado de 513 com o número esperado assumindo uma distribuição normal perfeita e uma pontuação média populacional de 0. Esse número é 584. Apenas 3,5% das corridas de simulação tiveram mais de 584 pontuações médias de seis jogos inferiores a -0,3. Isso é o que os estatísticos descreveriam como significativo semanalmente. Talvez a distribuição de pontuações reais de 6 jogos não seja aleatória, afinal.

Claro, o mesmo raciocínio deve se aplicar a equipes "em alta". A vitória sequencial deve diminuir suas probabilidades em relação às probabilidades de resultado reais, o que significa que também deve haver menos pontuações positivas significativas que o esperado. Mas isso não é o que percebemos nesta amostra de dados.

Há ainda mais para ser aprendido sobre aleatoriedade e eficiência nas apostas de futebol

Se há algo não aleatório a ser encontrado na distribuição dos resultados das apostas de futebol, esta análise confirma que é difícil de encontrar. De fato, há uma linha tênue entre o ruído aleatório e um sinal sistemático potencialmente explorável, que só se revelará para os apostadores mais talentosos e trabalhadores e em jogadas longas e repetidas.

Este artigo é o fruto desse trabalho. Não há nada novo, apenas a representação dessas ideias sob uma perspectiva diferente. Espero que seja útil para você.

Em geral, está claro que as probabilidades da Pinnacle são muito eficientes (mesmo que apenas em média), e as ineficiências sistemáticas, por exemplo, a falácia da mão quente, são evasivas. Além disso, na maior parte do tempo, a Pinnacle faz um trabalho muito bom para garantir que, se essas ineficiências existirem, elas permaneçam em grande parte dentro dos limites de suas margens. Tentar bater as probabilidades da Pinnacle, pelo menos no futebol da liga inglesa, não é algo recomendado para quem tem o coração fraco.

Recursos de apostas - Capacitar as suas apostas

Os Recursos de apostas da Pinnacle são um dos conjuntos mais abrangentes de conselhos de especialistas sobre apostas que se podem encontrar online. Dar resposta a todos os níveis de experiência - o nosso objetivo é simplesmente capacitar os apostadores a obterem mais conhecimentos.