set 19, 2017
set 19, 2017

As armadilhas dos sistemas de apostas desportivas: Correlação versus Causalidade

Sistemas de apostas desportivas: o que é a análise de regressão?

Utilizar um sistema para fazer previsões de apostas

As armadilhas da análise de regressão

As armadilhas dos sistemas de apostas desportivas: Correlação versus Causalidade

Quando se trata de garantir lucros a longo prazo com as apostas, é essencial utilizar um sistema de apostas. No entanto, os apostadores confundem muitas vezes a gestão do dinheiro e os sistemas de apostas, bem como a correlação e a causalidade, no que toca aos resultados. O que é um sistema de apostas e como é que se consegue saber a diferença entre correlação e causalidade? Continue a ler para ter a resposta.

O que é um sistema de apostas?

Contrariamente a um método de staking ou a uma estratégia de gestão de dinheiro, que propõe um método de atribuir montantes de parada às suas apostas, um sistema de apostas desportivas é uma metodologia estruturada de previsão desenvolvida sobre uma análise quantitativa de dados históricos concebida para superar a margem de lucro da casa de apostas e encontrar o valor positivo esperado.

Os apostadores frequentemente confundem a gestão de dinheiro e os sistemas de apostas – procure "sistema de apostas" no Google e a maior parte do que encontrará são estratégias como as de Martingale, Labouchere ou Fibonacci – mas, na verdade, são coisas diferentes.

A gestão do dinheiro muda simplesmente a natureza dos riscos associados com as suas apostas; no entanto, ela não consegue transformar um método de previsão perdedor num método vencedor ao longo do tempo. Pelo contrário, um sistema de apostas procura encontrar as "reais" probabilidades de algo acontecer num evento desportivo.

Sistemas de apostas desportivas: Análise de regressão?

O método mais amplamente utilizado para conceber um sistema de apostas desportivas é a análise de regressão estatística. Para aquelas pessoas pouco familiarizadas com a gíria estatística, isto pode parecer intimidativo, mas na verdade trata-se apenas de um método para calcular a relação entre as variáveis.

Embora a análise de regressão seja uma ferramenta útil para conceber um sistema de apostas, o seu ponto fraco subjacente é a incapacidade de distinguir entre correlação e causalidade.

A mais simples destas análises é a regressão linear simples, em que se consideram apenas duas variáveis: por exemplo, o número de golos que uma equipa marca (o preditor ou a variável independente) e a sua frequência de vitórias nos jogos (a resposta ou a variável dependente). 

No meu primeiro livro "Fixed Odds Sports Betting: Statistical Forecasting & Risk Management", abordei um modelo de regressão simples baseado na supremacia relativa de golos das duas equipas ao longo dos 6 jogos anteriores.

Ao utilizar uma amostra grande de jogos (neste caso, 8 épocas de 1993 a 2001), é possível representar graficamente a correlação entre as classificações calculadas dos jogos (a diferença de golos nos 6 jogos jogados da equipa da casa menos a diferença de golos nos 6 jogos da equipa adversária) e a frequência do resultado de cada jogo. Apresentamos abaixo a distribuição da classificação do jogo (a variável independente) versus a frequência de vitórias em casa (a variável dependente).

correlation-and-causation-inarticle.jpg

Embora os pontos de dados individuais no gráfico estejam um pouco dispersos, existe uma tendência linear óbvia que relaciona as duas variáveis: quanto melhor for a equipa da casa em relação à equipa adversária em termos da diferença de golos nos seus últimos 6 jogos, mais provável será que a equipa da casa venha a ganhar o jogo.

A curva de regressão representada no gráfico descreve essencialmente uma relação idealizada entre a supremacia relativa de golos e a frequência de vitórias em casa, depois de o ruído ou a sorte e o azar aleatórios terem sido eliminados.

Podemos descrever a curva acima mencionada por meio de uma equação; tratando-se de um modelo de regressão linear simples, ela assume a forma de y = mx + c, em que y é a variável dependente (a probabilidade de vitória), x é a variável independente, a classificação do jogo, m é a inclinação ou gradiente da curva de tendência (e uma medida da força da relação) e c é a constante ou ponto em que a curva interceta o eixo y (ou seja, x = 0). Neste exemplo, a equação é fornecida por:

% de vitórias em casa = (1,56 x classificação do jogo) + 46,5

Quando a classificação do jogo for zero (ou seja, quando tanto a equipa da casa como a equipa adversária estão mais ou menos equiparadas em termos de diferença de golos), a probabilidade de vitória é de 46,5%. Tal parece ser intuitivamente sensato, dado que cerca de 46% dos jogos de futebol acabam com uma vitória da equipa da casa. Nos casos em que a equipa da casa tem uma diferença líquida de dez golos a mais do que a equipa adversária nos últimos seis jogos, o modelo de regressão mostra que tais equipas normalmente ganham 62% das vezes. Com uma superioridade de 20 pontos, este valor aumenta para 78%. 

A nossa análise de regressão também nos pode indicar quanta da variabilidade na frequência de vitórias é explicada por este modelo de sistema de apostas. Neste caso, foi de 86%. Pode ver isto ilustrado pela bondade do ajuste da curva de tendência aos dados. Isto diz-nos que existe uma forte correlação entre as duas variáveis.

Utilizar um sistema para fazer previsões de apostas

Para transformar o nosso modelo de regressão num sistema de apostas plenamente funcional, precisamos agora de fazer previsões sobre jogos futuros e utilizá-las para identificar as apostas que detêm um valor esperado positivo.

A gestão do dinheiro muda simplesmente a natureza dos riscos associados com as suas apostas; no entanto, ela não consegue transformar um método de previsão perdedor num método vencedor ao longo do tempo.

Tal como a maioria das metodologias de modelação, o pressuposto padrão é de que o passado é o segredo para o futuro. Se os jogos anteriores com classificações de +10 terminarem com uma vitória da equipa da casa em 62% das vezes, então o pressuposto será que uma equipa da casa com uma supremacia de dez pontos em golos sobre os adversários terão uma probabilidade de 62% de ganhar o jogo. 

Podemos então simplesmente traduzir estas possibilidades nas "reais" probabilidades e, assim, encontrar o valor esperado numa casa de apostas que disponibiliza melhores probabilidades. Ao aplicar este modelo à época de futebol de 2001/02 da liga inglesa, consegui obter um lucro face ao volume de apostas de +2,1%, com as 526 apostas feitas com as melhores probabilidades disponíveis de vitória em casa, comparativamente com uma perda de -3,7%, se tivesse apenas apostado cegamente em tudo como vitórias em casa.

Correlação versus Causalidade

As apostas numa época com pouco mais de 500 apostas não garantem que se consiga reproduzir o lucro época após época. Pode parecer um número adequado para se ficar seguro de um sistema de apostas fiável, mas um leitor regular dos Recursos de apostas saberá que não é assim.

O artigo da Pinnacle sobre a lei dos pequenos números serve como lembrete de que até amostras de 1000 apostas podem revelar padrões ilusórios de lucro que, na realidade, não têm qualquer base de causalidade, mas que surgem simplesmente por acaso. Lamentavelmente, utilizar este sistema de apostas nas cinco épocas seguintes resultou sempre em perdas.

Embora este modelo de regressão simples sobre a supremacia de golos tenha sido ótimo para descobrir que equipas a jogar em casa têm mais probabilidade de ganhar, ele não garantiu que conseguia encontrar as equipas que tinham mais probabilidade de ganhar do que as possibilidades implícitas pelas probabilidades da casa de apostas.

Infelizmente, muitos apostadores desportivos interpretam muitas vezes erradamente a precisão, a exatidão e a validade quando analisam o seu historial de apostas, confundindo correlação e causalidade nesse processo.

O meu modelo pode ter sido bom a prever, mas aparentemente não foi melhor a prever do que os modelos utilizados pelas casas de apostas para definir as suas probabilidades, nem na realidade melhor do que os modelos utilizados pelos outros apostadores que ajudaram a moldar e a mudar essas probabilidades.

Se o meu modelo estivesse simplesmente a replicar o que os modelos das casas de apostas estavam a fazer, não haveria qualquer persistência em termos de lucro e ele simplesmente refletiria os caprichos da aleatoriedade. Parece que não foi criado sobre uma qualquer correlação válida. As previsões do meu modelo não "criaram" estes lucros, porque ele não era mais exato do que os outros modelos que faziam a mesma coisa.

Precisão versus Exatidão

É claro que um modelo de regressão linear de duas variáveis dificilmente será o sistema de apostas mais sofisticado para tentar encontrar o valor esperado. A regressão múltipla, na qual são introduzidas variáveis mais independentes ou preditivas, proporciona um meio de aumentar a precisão da previsão. No entanto, os analistas devem estar atentos de que esta não deve ocorrer à custa da exatidão.

Um modelo preciso é aquele em que as medições são próximas uma da outra; por exemplo, conforme ilustrado pela curva de tendência no meu modelo de regressão linear simples. Contudo, a precisão não garante a exatidão. A exatidão é a medida da proximidade a que você se encontra do valor "real". A precisão está associada a erros aleatórios e a exatidão a erros sistemáticos (também conhecidos como "viés"). 

Para que um sistema de apostas seja válido, ou seja, para que faça realmente o que é suposto fazer (isto é, encontrar de forma consistente o valor esperado e ter lucro), ele tem de ser preciso e exato em simultâneo. A validade implica tanto previsibilidade como persistência, ou seja, se aquilo que nós consideramos a causa é, na realidade, a causa verdadeira, e se a nossa medida aponta de forma repetida para tal conclusão.

Infelizmente, muitos apostadores desportivos interpretam muitas vezes erradamente a precisão, a exatidão e a validade quando analisam o seu historial de apostas, confundindo correlação e causalidade nesse processo. O seu erro está em acreditar que os lucros que obtiveram foram "causados" pelo seu sistema de apostas quando frequentemente acontece que esses lucros foram apenas resultado de boa sorte.

As armadilhas da análise de regressão

Embora a análise de regressão seja uma ferramenta útil para conceber um sistema de apostas, o seu ponto fraco subjacente é a incapacidade de distinguir entre correlação e causalidade. A análise de regressão é eficaz para identificar uma associação entre variáveis, por exemplo, os golos marcados e sofridos versus a possibilidade de ganhar os jogos, mas não é capaz de determinar se um causa o outro.

A análise de regressão pode mostrar-nos quando o Barcelona perde ou quando Lionel Messi não marca um golo. No entanto, não podemos concluir que o facto de Lionel Messi não estar a marcar seja a causa de o Barcelona perder o jogo.

Sem estabelecer a causalidade e a validade no nosso sistema de apostas, devemos ser cautelosos, pois o nosso modelo pode não ser melhor do que os modelos de previsão utilizados pelas outras pessoas. Num contexto de competências relativas como o das apostas desportivas, não nos pagam por simplesmente prevermos o futuro, temos de o fazer de maneira melhor do que todos os outros.

Recursos de apostas - Capacitar as suas apostas

Os Recursos de apostas da Pinnacle são um dos conjuntos mais abrangentes de conselhos de especialistas sobre apostas que se podem encontrar online. Dar resposta a todos os níveis de experiência - o nosso objetivo é simplesmente capacitar os apostadores a obterem mais conhecimentos.