jul 4, 2019
jul 4, 2019

Segunda parte: será que as casas de apostas assumem posições nos spreads de pontos?

Que dados estamos a analisar?

Aprofundar os spreads ainda mais

Sistemático ou aleatório?

Segunda parte: será que as casas de apostas assumem posições nos spreads de pontos?

A primeira parte deste artigo introduziu a ideia de que as casas de apostas assumem posições nos mercados de spreads de pontos devido ao excesso de confiança do mercado de apostas nas equipas favoritas. A segunda parte utiliza os dados recentes de apostas na NBA para tentar responder a essa pergunta. Continue a ler para saber mais.

Será que as casas de apostas assumem posições num mercado de apostas nos spreads de pontos? Na primeira parte deste artigo de apostas com duas partes, propus um exercício intelectual que explicaria o motivo pelo qual as casas de apostas fariam isso, e analisei evidências do economista Stephen Levitt que sugeriam que as casas de apostas estão a manipular os preços dos spreads na NFL com o objetivo de explorar a preferência dos apostadores em apoiar as equipas favoritas para cobrir o spread e aumentar os seus lucros.

Tal viés sistemático pode ser explicado pela confiança intuitiva: quanto mais confiança tiver um apostador de que uma equipa irá vencer (quanto maior for o favoritismo percecionado), mais provável será que também acredite que a equipa seja capaz de cobrir o spread de pontos.

Levitt tinha descoberto que 60% dos apostadores preferem apoiar a equipa favorita nos mercados de spread de pontos na NFL, mas que essas equipas favoritas só cobrem o spread em 48% das vezes. Para uma casa de apostas com uma margem teórica de 2,5%, tal distribuição da ação faria com que os seus lucros aumentassem 3,3%. 

Agora, pretendo investigar se é possível encontrar um viés similar num conjunto de dados mais recente sobre spread de pontos no mercado de apostas da NBA.

Que dados estamos a analisar? 

Para esta análise, utilizei um conjunto de dados de 12 épocas de resultados da NBA e probabilidades disponibilizadas pela Sportsbook Reviews. O período de análise abrange as datas entre 30 de outubro de 2007 e 5 de maio de 2019 e inclui 15 508 jogos da NBA. Os valores do spread que utilizei são os do fecho do mercado.

Ao escolher diferentes limiares de handicap de pontos para testar depois de termos representado graficamente os dados, corremos o risco de escolher arbitrariamente valores que nos ajudam a ajustar a hipótese aos dados, quando na realidade deveríamos estar a ajustar os dados à hipótese.

Não foram fornecidos preços reais, mas temos de partir do pressuposto de que, em média, os spreads representaram apostas especiais de 50-50 (1,95/1,95 ou 1,91/1,91 por exemplo, -105/-105 ou -110/-110 na notação de probabilidades norte-americana, depois de a margem ser aplicada). Se esse pressuposto for válido, os preços reais não são necessários para a análise que se segue. 

A Sportsbook Reviews relata que, antes de 2015, os valores dos spreads vêm da 5Dimes, Betonline, Bookmaker, Heritage, Pinnacle e Sportsbook.com e, depois dessa data, da Westgate Superbook com suplementos da 5Dimes e da Bookmaker. Não foram disponibilizadas informações mais precisas sobre que spreads individuais vêm de que casa de apostas específica. 

Dos 15 508 jogos, 15 311 tinham uma equipa favorita com handicap no fecho do mercado (no qual o handicap para uma das equipas era de ≤ -0,5). Em 254 desses jogos, a equipa favorita (e, obviamente, a equipa menos favorita também) cobriu exatamente o spread de pontos. Para os restantes 15 057 jogos, 7541, ou 50,08%, das equipas favoritas cobriram o spread, tendo 7516, ou 49,92% das equipas menos favoritas conseguido fazer o mesmo. A diferença numa perspetiva de expetativas de 50-50 tem um valor p no teste de qui-quadrado de 84%. Por outras palavras, não há qualquer diferença estatisticamente significativa a partir de nenhum viés sistemático qualquer que seja. O mesmo acontece para os 48%.

Aprofundar os spreads ainda mais

Esta conclusão dificilmente consegue replicar a análise de Levitt sobre a NFL. No entanto, não percamos ainda a esperança de encontrar um viés. Lembre-se de que a explicação da confiança intuitiva sugere que quanto maior for o favoritismo nas apostas simples, mais provável é que um apostador escolha também apoiar a equipa favorita no mercado de spread de pontos, incentivando as casas de apostas a manipular os seus spreads para os handicaps de pontos maiores.

O gráfico abaixo mostra a percentagem cumulativa de equipas favoritas que cobrem o spread, sendo os jogos ordenados pelo handicap de pontos e aparecendo as magnitudes de handicap maiores em primeiro lugar. Obviamente, a escala do eixo x não é linear, uma vez que há muito menos handicaps de pontos grandes do que pequenos. 

in-article-points-spread-in-article-1.jpg

Ignorando os handicaps maiores, nos quais a pequena dimensão da amostra aumenta a variação consideravelmente, os dados mostram evidências claras de um viés de spread de pontos, embora um que desapareceu na altura em que alcançamos handicaps de zero quando as equipas estão igualmente classificadas. Por exemplo, nos 1303 jogos com magnitudes de handicap ≥ 12, apenas 47,0% das equipas favoritas conseguiram cobri-lo. Relativamente aos 2600 jogos que tinham magnitudes de handicap de fecho ≥ 10, 48,3% das equipas favoritas cobriram o spread. E em relação aos 4701 jogos que tinham magnitudes de handicap de fecho ≥ 8, o número era de 49,4%.

Sistemático ou aleatório?

A questão agora é saber se este viés tem significado ou é estatisticamente significativo ou é apenas uma conclusão de sorte que resulta de uma amostra de pequena dimensão. Considerando as magnitudes de handicap ≥ 12, um teste de t confirma que a possibilidade de 47% das equipas favoritas cobrirem o spread (dada uma expetativa de 50%) ocorreria por acaso em apenas 0,3% das vezes.

Normalmente, tal seria considerado como estatisticamente significativo (valores de p < 5% ou 1% são normalmente considerados como referências críticas de significância estatística), e excluiríamos a hipótese nula de que não deve haver um viés a favor de outra hipótese diferente, nos casos em que existe algum tipo de viés nos spreads por algum motivo. Conforme indicado na primeira parte, o motivo mais óbvio para tal é o facto de as casas de apostas estarem a manipular os respetivos spreads para explorar os apostadores.

Infelizmente, há três ressalvas. Em primeiro lugar, o valor de p associado ao limiar de handicap de 10 pontos, de 1,7%, é menos significativo em termos estatísticos, enquanto o valor de p para o limiar do handicap de 8 pontos, de 25,2%, não é de todo estatisticamente significativo.

Em segundo lugar, a utilização do teste de t pode não apropriada na realidade neste caso, uma vez que estamos a lidar com contagens de dados (o número de vezes que as equipas cobrem os spreads) que podem não se adaptar a uma distribuição de dados conhecida. Em vez disso, podemos utilizar o teste do qui-quadrado não paramétrico, sem distribuição, mais robusto, mas menos potente. O valor de p do teste do qui-quadrado para o limite do handicap de 12 pontos, por exemplo, é de 3,3%.

Quanto mais confiança tiver um apostador de que uma equipa irá vencer (quanto maior for o favoritismo percecionado), mais provável será que também acredite que a equipa seja capaz de cobrir o spread de pontos.

Finalmente, não é de todo óbvio que handicap de pontos deveremos considerar quando procuramos um viés. Ao escolher diferentes limiares de handicap de pontos para testar depois de termos representado graficamente os dados, corremos o risco de escolher arbitrariamente valores que nos ajudam a ajustar a hipótese aos dados, quando na realidade deveríamos estar a ajustar os dados à hipótese. Este tipo de prospeção de dados (“data mining”) nunca é boa ideia. Os apostadores que andam à procura de “descobrir” sistemas rentáveis desta forma fazem-no por sua conta e risco.

No extremo oposto, podemos calcular um valor de p para cada ponto na série de valores classificados de handicap de pontos. Neste caso, significaria 15 310 valores. Tal cria um problema de comparações múltiplas, em que realizamos um conjunto de testes estatísticos em simultâneo, tendo cada qual o potencial de “descobrir” uma inferência significativa. Por exemplo, se um teste for realizado com um valor p crítico (limiar de significância estatística) de 5% de nível e a hipótese nula – de que nada está a funcionar, a não ser o acaso – for verdadeira, há apenas uma hipótese de 5% de rejeitar incorretamente a hipótese nula.

No entanto, se se realizarem 100 testes em que todas as hipóteses nulas correspondentes são verdadeiras, e os testes forem estatisticamente independentes uns dos outros, a possibilidade de, pelo menos, uma rejeição incorreta é de 99,4%. Não podemos, portanto, ter muita fé nos nossos testes das hipóteses a não ser que apliquemos algum tipo de correção.

Um método frequentemente utilizado é a correção de Bonferroni. Para realizar uma correção de Bonferroni, divide-se simplesmente o valor p crítico pelo número de comparações a serem feitas. Por exemplo, se o valor crítico de um único teste for de 5%, com 10 testes simultâneos, esse valor seria reduzido para 0,5%. Se nenhum dos 10 valores p ficar abaixo desse limiar mais exigente, ser-nos-ia impossível excluir a hipótese nula de que tudo o que estamos a ver aconteceu apenas por acaso. 

O gráfico seguinte mostra a evolução de um valor p para o teste de t e para o teste do qui-quadrado para amostras cumulativas e consecutivas de jogos na série classificada pelos handicaps de pontos. O eixo de y é logarítmico. Também apresentamos o valor de p crítico com a correção de Bonferroni partindo do princípio de que o valor crítico para um teste é de 5% e que foram realizados 15 310 testes em simultâneo.

in-article-points-spread-in-article-2.jpg

Os testes do qui-quadrado não paramétricos mostram de forma sistemática valores de p mais conservadores e são, provavelmente, os testes mais apropriados a que prestar atenção. Contudo, mesmo para os valores de p no teste de t, não havia um único número que alcançasse o valor crítico corrigido que nos permitisse excluir o acaso como o único motivo para vermos o que vemos.

Falando em termos rigorosos, a correção de Bonferroni parte do princípio de que todos os testes simultâneos são independentes uns dos outros. Evidentemente, numa série classificada de handicaps de pontos, em que estamos progressivamente a tentar descobrir se amostras consecutivamente maiores de equipas favoritas estão coletivamente a cobrir o spread em menos de 50% das vezes, este não será o caso. Assim, o nosso limiar crítico corrigido é provavelmente demasiado conservador. Não obstante, ilustrei esta metodologia para destacar as potenciais armadilhas de presumir a existência de uma significância estatística quando ela pode não existir na realidade. 

O que aprendemos com esta análise?

Falando em termos qualitativos, resumiria estas conclusões da seguinte forma. Sim, parece de facto haver um viés nos spreads de pontos das equipas favoritas no mercado de apostas da NBA, mas só existe realmente para os maiores valores de handicap. Se este viés tem alguma significância estatística que sugira um motivo causal que não seja o acaso para a sua existência, por exemplo a manipulação dos spreads pela casa de apostas, então é provável que seja fraco.

Se as casas de apostas estão a manipular o spread da forma que Levitt sugeriu que fazem para a NFL, tal manipulação tem um âmbito limitado. O viés intuitivo poderá explicar o motivo pelo qual os apostadores apostam excessivamente nos maiores handicaps, mas se o fazem, as casas de apostas só podem explorar este aspeto na mais mínima das formas. Se tentarem explorar isso ao mudar mais os spreads, o comportamento dos apostadores responderá provavelmente de forma não linear, eliminando qualquer expetativa de lucro adicional que a casa de apostas esperasse ter.

Se tivesse apostado contra os favoritos nesta amostra de 12 épocas como faria um apostador contracorrente, eis como os seus rendimentos teriam evoluído com o handicap de pontos classificados partindo do princípio que havia preços de 1,95 (-105) e a margem da casa de apostas era de 2,5%.

in-article-points-spread-in-article3.jpg

Sim, pode ter-se potencialmente alguma rentabilidade ao ser-se contracorrente e apoiar as maiores equipas menos favoritas em como cobrem o spread. No entanto, é uma rentabilidade pequena e permanece a questão de ser realmente estatisticamente significativa e, portanto, persistente no futuro. À semelhança do viés do “favourite–longshot” nos mercados de apostas com probabilidades fixas, a potencial rentabilidade que existe devido à sua presença está limitada a fazer apostas apenas contra os maiores dos favoritos, enquanto a maior parte do mercado fica dentro das tolerâncias de risco definidas pela margem da casa de apostas.

Certamente, não há qualquer diferença entre todas as equipas favoritas e as equipas menos favoritas em termos mais gerais em todos os valores dos spreads; cobrem o spread da mesma forma que as outras. Embora possam existir bolsas de ineficiência para as equipas favoritas mais fortes, os preços médios do spread na NBA parecem ser muito representativos das verdadeiras possibilidades de as equipas cobrirem tais spreads.

Se alguma vez existiu um viés mais geral na altura em que Levitt estava a estudar os mercados da NFL, parece que terá em larga medida desaparecido. Assim que as ineficiências se tornam do conhecimento público, terão apenas um prazo de validade limitado.

Recursos de apostas - Capacitar as suas apostas

Os Recursos de apostas da Pinnacle são um dos conjuntos mais abrangentes de conselhos de especialistas sobre apostas que se podem encontrar online. Dar resposta a todos os níveis de experiência - o nosso objetivo é simplesmente capacitar os apostadores a obterem mais conhecimentos.