jul 4, 2019
jul 4, 2019

Del två: Tar spelbolagen positioner på handikappmarknader?

Vilka data är relevanta?

En närmare titt på handikappen

Systematiskt eller slumpmässigt?

Del två: Tar spelbolagen positioner på handikappmarknader?

Del ett av den här artikeln tog upp hypotesen om att spelbolag tar positioner på handikappmarknaderna på grund av marknadens övertro på favoriter. I del två är målet att bedöma sanningshalten i den hypotesen med hjälp av nyligen inhämtade NBA-bettingdata. Läs vidare för att få reda på mer.

Tar spelbolagen positioner på handikappmarknader? I den första delen av den här tvådelade artikeln förklarade jag med ett tankeexperiment varför spelbolagen skulle kunna göra det, och jag granskade material av ekonomen Stephen Levitt som gav vid handen att spelbolagen manipulerar NFL-handikappoddsen i syfte att utnyttja spelarnas övertro på att favoriten ska väga upp handikappet.

En så systematisk bias kan förklaras av intuitiv övertro, det vill säga att ju mer övertygad en spelare är om att ett lag ska vinna, desto mer troligt är det att spelaren även tror att laget ska väga upp handikappet.

Inte nog med att Levitt fann att 60% av spelarna föredrar att backa favoriten på NFL-handikappmarknader – han fann även att favoriterna bara lyckas väga upp handikappet i 48% av fallen. En sådan spelfördelning skulle leda till att ett spelbolag med en teoretisk marginal på 2,5% ökar sin förtjänst till 3,3%. 

Nu ska jag försöka ta reda på om en liknande bias kan hittas i mer sentida handikappdata från NBA-oddsmarknaderna.

Vilka data är relevanta? 

I den här analysen har jag tittat på NBA-resultat och -odds för 12 säsonger hämtade från Sportsbook Reviews. Analysperioden sträcker sig från den 30 oktober 2007 till den 5 maj 2019 och omfattar 15 508 NBA-matcher. Jag har tittat på de handikappvärden som gällde när marknaden stängde.

Om vi plottar datan innan vi testar olika handikapptrösklar löper vi risk att godtyckligt välja värden som stöder hypotesen. Det vore att börja i fel ände.

Inga faktiska odds har tillhandahållits men i genomsnitt får man anta att handikappen representerade 50/50-sannolikheter, det vill säga odds på till exempel 1,95/1,95 eller 1,91/1,91 efter att marginalen tillämpats (-105/-105 eller -110/-110 med amerikanska odds). Om det antagandet stämmer behöver man inte titta på några faktiska odds för att genomföra analysen. 

Sportsbook Reviews rapporterar att handikappvärdena före 2015 kom från 5Dimes, Betonline, Bookmaker, Heritage, Pinnacle och Sportsbook.com, och att de därefter primärt kom från Westgate Superbook och delvis från 5Dimes och Bookmaker. Ingen exakt information ges om vilka handikappvärden som kommer från respektive spelbolag. 

Av de 15 508 matcherna hade 15 311 en handikappfavorit när oddsmarknaden stängde (där handikappet för ett av lagen var ≤ -0.5). I 254 av de matcherna vägde favoriten (och naturligtvis även underdogen) upp poänghandikappet exakt. Av de övriga 15 057 matcherna vägde favoriten upp handikappet i 7 541 matcher (det vill säga 50,08%) medan motsvarande siffra för underdoglagen var 7516 (49,92%). Avvikelsen från en förväntad 50/50-fördelning har ett chi-två-test-p-värde på 84%. Med andra ord finns det ingen statistiskt signifikant skillnad mellan det och när ingen systematisk bias finns över huvud taget. Att favoriten bara väger upp handikappet i 48% av fallen verkar alltså inte stämma.

En närmare titt på handikappen

Den här observationen ligger knappast i linje med Levitts NFL-analys. Men låt oss inte ge upp hoppet om att hitta en bias riktigt än. Man måste komma ihåg att observationen om intuitiv övertro tyder på att ju större favorit ett visst lag är att vinna en match, desto mer sannolikt är det att spelarna även väljer att spela på att favoriten ska väga upp handikappet. Det skapar incitament för spelbolagen att manipulera sina handikapp för storfavoriter.

Diagrammet nedan visar hur stor sammanlagd procentuell andel av favoriterna som vägt upp sina handikapp. Matcherna är sorterade efter storleken på handikappet från högst till lägst. Naturligtvis är skalan på x-axeln inte linjär eftersom det finns långt färre stora poänghandikapp än små. 

in-article-points-spread-in-article-1.jpg

Om man ignorerar de största handikappen där den låga urvalsstorleken medför en avsevärd variansökning tyder dessa data klart och tydligt på att det finns en handikappbias, men att den försvinner när man når nollhandikapp för lag som är jämnstarka. I de 1 303 matcher som hade handikappstorlekar på ≥ 12 väger bara 47,0% av favoriterna upp handikappet. I de 2 600 matcher som hade handikappstorlekar på ≥ 10 vägde 48,3% av favoriterna upp handikappet. Och I de 4 701 matcher som hade handikappstorlekar på ≥ 8 var motsvarande siffra 48,3%.

Systematiskt eller slumpmässigt?

Frågan är om den här biasen är statistiskt signifikant och verkligen säger något, eller om den bara uppstått slumpmässigt på grund av liten urvalsstorlek. Vid handikapp på ≥ 12 bekräftar ett t-test att den observerade sannolikheten på 47% för att favoriten ska väga upp handikappet (vid en förväntan på 50%) bara har 0,3% chans att uppstå på grund av ren slump.

I vanliga fall skulle det betraktas som statistiskt signifikant (p-värden på < 5 % eller 1 % betraktas vanligen som tröskelvärden för statistisk signifikans), och vi skulle då kunna utesluta nollhypotesen om att det inte bör finnas någon annan bias när en viss form av handikappbias redan existerar. Det mest uppenbara skälet till att handikappbias existerar är att spelbolagen manipulerar sina handikapp för att utnyttja spelarna.

Det finns tyvärr tre förbehåll. För det första är p-värdet för tröskeln för 10-poängshandikapp (1,7%) mindre statistiskt signifikant, medan p-värdet för tröskeln för 8-poängshandikapp (25,2%) inte är statistiskt signifikant alls.

För det andra är det eventuellt inte lämpligt att använda t-testet i det här fallet med tanke på att vi har att göra med datavärden (antalet gånger som lagen väger upp handikappet) som eventuellt inte överensstämmer med en redan känd datafördelning. Istället kan vi använda det mer robusta men mindre kraftfulla icke-parametriska, fördelningsfria chi-två-testet. Chi-två-testets p-värde för 12-poängshandikapptröskeln är till exempel 3,3%.

Ju mer övertygad en spelare är om att ett lag ska vinna, desto mer troligt är det att spelaren även tror att laget ska väga upp handikappet.

Slutligen är det långt ifrån uppenbart vilka poänghandikapp vi bör titta på när vi letar efter en bias. Om vi plottar datan innan vi testar olika handikapptrösklar löper vi risk att godtyckligt välja värden som stöder hypotesen. Det vore att börja i fel ände. Det typen av datautvinning är ingen bra idé. Spelare som på det sättet försöker "upptäcka" lönsamma system är fel ute.

Som extremfall skulle vi kunna räkna fram ett p-värde för varje punkt i serien av rankade poänghandikappvärden. Det skulle innebära 15 310 stycken. Detta leder till signifikansproblem när vi utför flera samtidiga statistiska tester som vart och ett har potential att "upptäcka" en meningsfull slutsats. Om ett test till exempel utförs vid ett kritiskt p-värde (tröskelvärde för statistisk signifikans) på 5% och nollhypotesen (det vill säga att det bara är slumpen om styr) stämmer finns det bara 5% risk att felaktigt avfärda nollhypotesen.

Men om 100 test utförs när alla motsvarande nollhypoteser stämmer, och testerna är statistiskt oberoende av varandra, är sannolikheten för minst ett felaktigt avfärdande 99,4%. Då vågar vi knappast lita på vår hypotestestning såvida vi inte tillämpar någon form av korrigering.

En vanlig sådan är Bonferroni-korrigeringen. För att utföra en Bonferroni-korrigering dividerar man helt enkelt det kritiska p-värdet med antalet gjorda jämförelser. Om till exempel det kritiska värdet för ett visst test var 5% skulle det minska till 0,5% vid 10 samtidiga tester. Om inget av de 10 p-värdena faller under det striktare tröskelvärdet skulle vi inte kunna avfärda nollhypotesen som går ut på att allt vi observerar bara beror på slumpen. 

Nästa diagram visar p-värdets utveckling för t-testet och chi-två-testet för konsekutiva kumulativa matchurval i serien rankade efter poänghandikapp. Y-axeln är logaritmisk. Lägg även märke till det Bonferroni-korrektionskritiska p-värdet som förutsätter att det kritiska värdet för ett test är 5% och att 15 310 samtidiga test utfördes.

in-article-points-spread-in-article-2.jpg

De icke-parametriska chi-två-testen visar systematiskt mer konservativa p-värden och är troligen de som är lämpligast att titta på. Men inte ens för t-testens p-värden fanns det en enda siffra som uppnådde det korrigerade kritiska värde som skulle kunna göra det möjligt att avfärda nollhypotesen.

I grund och botten utgår Bonferroni-korrigeringen från att alla samtidiga test är oberoende av varandra. Men det är uppenbarligen inte fallet i en rankad serie poänghandikapp där vi systematiskt försöker komma fram till om ett större urval av favoriter kollektivt väger upp handikappet i mindre än 50% av fallen. Därför är risken stor att vårt korrigerade kritiska tröskelvärde är alltför konservativt. Men jag har ändå valt att illustrera den här metoden för att poängtera riskerna med att anta att statistisk signifikans finns när den eventuellt inte gör det. 

Vad har vi lärt oss av den här analysen?

Kvalitativt skulle jag vilja summera dessa observationer enligt följande. Visserligen tycks det finnas en handikappbias för favoriter på NBA-oddsmarknader, men den tycks egentligen bara existera för de allra största handikappvärdena. Om det finns någon statistisk signifikans för den här biasen som antyder att något annat än slump ligger bakom (till exempel handikappmanipulering av spelbolaget) så är den troligen svag.

Om spelbolagen manipulerar handikappen på det sätt som Levitt tror att de gör för NFL kan man konstatera att den typen av manipulation är begränsad. Intuitiv bias kanske kan förklara varför spelarna satsar oproportionerligt mycket på de största handikappen, men spelbolaget kan i så fall bara utnyttja det minimalt. Om de försöker utnyttja det mer genom att justera handikappen ytterligare lär spelarnas spelmönster ändras icke-linjärt, och då avlägsnas all eventuell ytterligare förtjänst som spelbolaget hade hoppats på.

Om du hade varit motvalls och spelat mot favoriten under dessa 12 säsonger hade din avkastning kunnat utvecklas enligt följande (med rankade poänghandikapp som utgår från odds på 1,95 och en spelbolagsmarginal på 2,5 %):

in-article-points-spread-in-article3.jpg

Uppenbarligen finns det viss potentiell lönsamhet i att vara motvalls och spela på att stora underdogs ska väga upp handikappet. Men lönsamheten är liten, och frågan är om den verkligen är statistiskt signifikant och kommer att finnas kvar i framtiden. I likhet med underdogbiasen på fasta oddsmarknader är den potentiella lönsamheten begränsad till när man spelar mot de allra största favoriterna, medan majoriteten av marknaderna ligger klart inom den risktolerans som spelbolagets marginal utgör.

Det finns ingen generell skillnad mellan favoriter och underdogs ur ett större perspektiv när man tar med alla handikappvärden i beräkningen. De väger helt enkelt upp handikappet lika mycket. Vissa svagheter på oddsmarknaderna kan finnas för de största favoriterna, men i genomsnitt tycks NBA-handikappen vara högst representativa för lagens verkliga sannolikheter att väga upp handikappen.

Man kan inte avfärda möjligheten att det förelåg en större bias när Levitt granskade NFL-marknader, men den tycks i så fall i princip ha försvunnit sedan dess. Om det finns en svaghet på oddsmarknaden som går att utnyttja försvinner den ofta snabbt så snart den blir allmän kännedom.

Oddsresurser: Bli en bättre spelare

Pinnacles avdelning Oddsresurser är en av nätets mest omfattande artikelsamlingar med spelråd från experter. Vi tillgodoser behoven hos både nybörjare och proffs – vårt mål är helt enkelt att öka våra spelares kunskaper.