maj 6, 2020
maj 6, 2020

Oddssättningens asymmetri

Två typer av osäkerhet

Modellera osäkerhet i ett oddssammanhang

Betting i den riktiga världen

Oddssättningens asymmetri

Det är allmänt accepterat att det är en extremt svår uppgift att slå ett spelbolag, framförallt ett spelbolag som Pinnacle. Men varför är det så svårt? Kan man dra någon lärdom av att betrakta det ur ett spelbolags perspektiv och därigenom få en förståelse för hur bra man måste vara för att vinna på odds? Läs vidare för att få reda på det.  

Under månaderna som idrott inte har funnits i våra liv har jag funderat över om det är möjligt att mäta hur bra en spelare måste vara för att slå ett spelbolag. Som vanligt pratar jag inte om turliga vinster, utan långsiktig förväntad lönsamhet genom att använda principerna för värdespel.

För att uppnå detta måste vi vara bra nog att även slå spelbolagets marginal. Det faktum att en så liten andel av spelarna verkar klara detta är bevis på att det är ganska svårt, även när marginalen är så liten som 2 %.

Dessutom kommer de som har läst mina artiklar eller följt mig på Twitter känna till flera av de Excel-verktyg jag har använt för att mäta den statistiska sannolikheten att uppnå positivt väntevärde och hur dessa prestationer kan förväntas fördelas givet vissa antaganden om oddsspelande och insatsmetoder.

Men det jag vill undersöka den här gången är exakt vad "att vara bättre än spelbolaget" innebär ur ett ovisshetsperspektiv. Att spela på odds är som vi vet en osäker verksamhet även för de som är allra bäst på att förutspå resultaten. Hur mycket mindre ovissa behöver vi bli för att övervinna marginalen och bli vinnare i längden?

Genom försök att simulera ett svar framgår det hur bra spelbolagen faktiskt är och varför de måste vara det för att själva förbli lönsamma. Detta är oddssättningens asymmetri

Två typer av osäkerhet

I mina två senaste artiklar för Pinnacle har jag diskuterat två typer av ovisshet – eller osäkerhet. För det första finns det en aleatorisk eller statistisk osäkerhet. Den avser den inneboende ovissheten till följd av den probabilistiska variationen. Om du upprepar en process många gånger (till exempel singlar en slant) så kan du se att små variationer i startförhållanden ger olika resultat. Dessa skillnader förblir okända. Aleatorisk osäkerhet går inte att förenkla. 

Det kommer att finnas några, som Laplaces demon, som kan hävda att detta helt enkelt är en följd av begränsad information och bearbetningskapacitet. Om vi visste alla startförhållanden exakt, skulle vi med säkerhet också kunna förutsäga de exakta resultaten.

I praktiken minskar komplexiteten i dessa system sådan informationsinsamling till en omöjlig nivå. Kanske ännu viktigare är emellertid att den probabilistiska snarare än den deterministiska verklighetens natur i liten skala innebär, till och med i teorin, att denna uppgift är dömd att misslyckas.

Om spelbolaget går för långt i sin bedömning av de sanna oddsen finns det en rimlig chans att spelaren också kommer att göra det, och vice versa. Vissa spelare kan också delvis vara knutna till spelbolagets odds.

Det är just av denna anledning som det är vettigt att prata om "sanna" sannolikheter för resultat och inte luras att tro att de deterministiskt är 0 % eller 100 %. I idrott, till skillnad från slantsingling eller tärningskast, vet vi inte eller kan vi inte veta den "sanna" sannolikheten (därav citationstecknen), men det är klokt att prata om det som att de finns.

Den andra typen av osäkerhet är epistemisk osäkerhet eller modellosäkerhet och uppstår på grund av ofullständig förståelse för vad vi försöker modellera. Epistemisk osäkerhet kan minskas om man får mer kunskap om modellen.

Målet med kvantifiering av ovissheten är att förvandla epistemiska osäkerheter till aleatoriska osäkerheter, även om gränsen mellan de två i praktiken kan vara svår att identifiera på grund av systemkomplexitet och verklighetens natur.

I sin lysande artikel Toward a theory of everything beskrev gästskribenten @PlusEVAnalytics för Pinnacles läsare dessa två typer av osäkerhet som processosäkerhet (aleatorisk) respektive parameterosäkerhet (epistemisk). Genom att återge hans exempel kommer vi förhoppningsvis kunna förtydliga skillnaden.

"Anta att du ger ett fotbollslag 60 % sannolikhet att vinna, du satsar på dem till dubbla pengarna, och de förlorar. Varför förlorade du spelet? Du kanske hade rätt i din bedömning, men du hade otur – 40 %-händelsen inträffade och du förlorade ditt spel. Detta är processosäkerhet (aleatorisk) – bra spel, oturligt utfall. Å andra sidan kanske du gjorde en felaktig bedömning – den verkliga sannolikheten kan ha varit 50 %, eller 30 % eller till och med 1 %. Du satsade på något som du trodde var ett bra spel, men som egentligen var dåligt. Detta är parameterosäkerhet (epistemisk). Eftersom den verkliga sannolikheten är okänd är det mycket svårt att ta reda på hur stor del av dina utfall – både bra och dåliga – som drivs av processosäkerhet i motsats till parameterosäkerhet."

Modellera osäkerhet i ett oddssammanhang

I en spelmiljö kommer den aleatoriska osäkerheten vara densamma för alla. Samma evenemang äger rum i en idrottstävling, med samma variabler som påverkar. Alla spelare ställs inför samma scenario.

Det är enkelt att modellera aleatorisk osäkerhet med hjälp av en enkel slumptalsgenerator. Anta att vi har en 50–50-tävling, med rättvisa odds på 2,00. För att modellera aleatorisk osäkerhet kan vi helt enkelt använda en slumptalsgenerator för att mata ut siffror mellan 0 och 1. Under 0,5 innebär ett vinnande spel. Över 0,5 innebär ett förlorande. Fördelningen av utfall (vinnande och förlorande spel) skulle sedan följa en binomialfördelning.

Att modellera epistemisk osäkerhet är lite mer problematiskt eftersom det inte alls är uppenbart vilken slags fördelning som skulle uppstå till följd av sådana fel. @PlusEVAnalytics använde en betafördelning för att modellera det, men han är mycket smartare än vad jag är så jag kommer nöja mig med normalfördelningen. Vidare kommer jag att anta att denna fördelning av epistemiska fel är centrerad kring den sanna utfallssannolikheten, som jag har beskrivit nedan. Om det finns systematiska biaser kommer det självklart inte att stämma.

För spelbolaget är det här i alla fall inte ett orimligt antagande eftersom jag redan har visat att Pinnacles odds är ytterst effektiva på större sportmarknader. Det vill säga att de i genomsnitt återspeglar de underliggande sanna utfallssannolikheterna även om det i det enskilda fallet kommer att finnas fel. Om detta också är sant för spelarna är nog inte lika säkert.

Fördelning i epistemisk osäkerhet

För att modellera effekten av epistemisk osäkerhet har jag skapat en serie med 1 000 hypotetiska spel, där den sanna sannolikheten för att vinna varje spel är 50 %. För varje spel uppvisar min hypotetiska prognosmodell ett visst epistemiskt fel i sin bedömning av de sanna vinstsannolikheterna, vars storlek bestäms av sex olika standardavvikelser: 0 %, 1 %, 2 %, 3 % 4 % och 5 %. För en standardavvikelse på 1 % så kommer exempelvis drygt två tredjedelar av de modellerade "sanna" vinstsannolikheterna att vara mellan 49 % och 51 %, och cirka 95 % vara mellan 48 % och 52 %.

För större standardavvikelser kommer spridningen i dessa "sanna" vinstsannolikheter, som tas fram av prognosmodellen, att vara större. Detta illustreras i diagrammet nedan. Med en standardavvikelse på 0 % skulle förstås alla vinstsannolikheter vara exakt 50 %, så där visas inte linjen. Ju bredare fördelningen är, desto större är den epistemiska osäkerheten.

asymmetry-inarticle-Picture-1.jpg

Det framgår av diagrammet att medan var och en av dessa vinstsannolikhetsfördelningar representerar en effektiv modell – medelvärdet är alltid 50 % – varierar den epistemiska osäkerheten.

Att invertera de "sanna" vinstsannolikheterna ger oss fördelningen av odds. På grund av det omvända förhållandet mellan vinstsannolikheten och de underförstådda oddsen, kommer de att vara lognormalfördelade.

För ett urval bestående av 1 000 insatser innebär det att modellerade "sanna" odds vanligtvis varierar mellan 1,88 och 2,13, 1,78 och 2,28, 1,69 och 2,46, 1,60 och 2,66, samt 1,52 och 2,89 för standardavvikelser på 1 %, 2 %, 3 %, 4% respektive 5%.

asymmetry-inarticle-Picture-2.jpg

Spelbolag kontra Spelare

Låt oss använda den här modellen för epistemisk osäkerhet på de sanna oddsen för att skapa en tävling mellan spelbolaget och spelaren. För varje spel lägger spelbolaget upp vad de tror är det sanna oddset minus 2,5 % i marginal. De skulle till exempel lägga upp 1,95 om de trodde att det sanna oddset var 2,00. Över de 1 000 spelen kommer dessa odds att variera beroende på fördelningarna ovan.

Spelaren har en annan modell och använder den för att uppskatta vad han tycker att de sanna oddsen bör vara. Om spelbolagets publicerade odds är högre än spelarens uppskattning, satsar spelaren 1 enhet. Annars placeras inget spel.

När spelen rättas är det sanna oddset för varje insats 2,00 (okänt för både spelbolag eller spelare) och en slumptalsgenerator används för att bestämma utfallet. Som tidigare förklarats är varje varians här en följd av aleatorisk osäkerhet.

Tävlingen upprepades med en Monte Carlo-simulering 10 000 gånger. Titta först på det genomsnittliga antalet spel som lades för var och en av spelbolags-spelarens 36 olika epistemiska osäkerhetspar. Ju större epistemisk osäkerhet (visas i rad- och kolumnrubrikerna), för antingen spelaren eller spelbolaget, desto mer troligt är det att skillnaden mellan de två modellerna blir större än marginalen, och desto mer sannolikt är det att ett spel kommer att läggas.

asymmetry-inarticle-Picture-3.jpg

När både spelbolag och spelare är perfekta är det förstås omöjligt för några spel att äga rum eftersom spelbolaget alltid kommer att lägga upp oddset 1,95 och spelaren alltid kommer att veta att det är lägre än det sanna oddset. 

Den andra tabellen visar den genomsnittliga (förväntade) avkastningen som spelaren lyckades uppnå för varje osäkerhetspar. Kom ihåg att ju mindre standardavvikelsen är, desto lägre är den epistemiska osäkerheten och desto bättre är modellen.

asymmetry-inarticle-Picture-4.jpg

När spelbolaget är perfekt och gör exakta sannolikhetsbedömningar för varje spel, kommer spelaren föga förvånande förlora ett belopp motsvarande storleken på marginalen (-2,5 %). Den lilla variationen kring denna siffra är helt enkelt en följd av aleatorisk osäkerhet. En större Monte Carlo-simulering skulle minska denna variation.

Lägg också märke till att det räcker att spelarens modell är bättre (mindre osäker) än spelbolagets för att generera en förväntad vinst. Men det finns också något som är ganska förbryllande. När spelbolagets modell är dålig kan spelaren ändå göra en förväntad vinst även med en sämre modell. Om till exempel spelbolagets epistemiska osäkerhet har en standardavvikelse på 3 % i vinstsannolikhet kan spelaren fortfarande förvänta sig att gå +0,68 %, då modellen har en standardavvikelse på 5 %. Detta verkar väldigt konstigt. 

Oddssättningens asymmetri

För att lösa denna paradox måste vi titta på hur tävlingen har konstruerats. Precis som på alla oddsmarknader sätter spelbolaget ett odds. Spelarna måste sedan besluta sig för om de kommer att anta utmaningen, och endast göra det om det publicerade oddset är högre än deras eget uppskattade "sanna" odds. Om det skulle hända får spelbolaget inte chansen att dra tillbaka spelerbjudandet.

Om någon epistemisk osäkerhet är närvarande i mitt modellscenario, kommer 50 % av spelbolagets fel att förutsäga "sanna" odds som är högre än de verkligt sanna oddsen (på 2,00) och 50 % som är lägre. På samma sätt kommer 50 % av spelarens fel antingen att vara högre eller lägre än 2,00. 

Vi kan aldrig veta vad spelbolaget verkligen tror att de ”sanna” oddsen för sina marknader är. Inte heller kan vi veta vad de verkligt sanna oddsen av dessa uppskattningar är.

Men när spelbolagets odds är lägre än 2,00 är det mindre sannolikt att spelarens odds är ännu lägre och att ett spel placeras. Omvänt är sannolikheten för att ett spel placeras högre när spelbolagets odds är för höga.

Denna asymmetri leder till en större andel spel med positiva väntevärden jämfört med negativa. Ju större epistemisk osäkerhet, desto större asymmetri. När både spelbolaget och spelaren uppvisar en osäkerhet i standardavvikelsen på 2 %, har 56 % av spelen positivt väntevärde och det genomsnittliga oddset är 2,01. När osäkerheten i standardavvikelsen stiger till 5 % för båda, placeras 68 % av spelen till odds över 2,00 med ett genomsnitt på 2,10. 

Om vi istället använder en annan modell där både backaren och bokaren måste komma överens om huruvida man ska spela på odds som lades upp av en tredje part, försvinner denna asymmetri till stor del. Då tävlar båda även mot samma tredje part och deras modell med epistemisk osäkerhet. Om den tredje partens epistemiska osäkerhet är liten, och både backaren och bokaren har lika osäkra modeller, kommer de att förlora ett belopp som motsvarar den tredje partens marginal. 

Betting i den riktiga världen

Alla dessa slutsatser baseras på ett stort och förmodligen orealistiskt antagande. Det har antagits att spelbolagets och spelarens modeller är helt oberoende av varandra. I verkligheten är det osannolikt att så är fallet eftersom modellerna tenderar att använda liknande data och liknande prognosalgoritmer. 

Om spelbolaget går för långt i sin bedömning av de sanna oddsen finns det en rimlig chans att spelaren också kommer att göra det, och vice versa. Vissa spelare kan också delvis vara knutna till spelbolagets odds.

Varje modellkorrelation mellan spelbolag och spelare kommer att minska spelarens väntevärde och göra det svårare för honom att lyckas.

Ändå ger denna modell för epistemisk osäkerhet en ledtråd om hur bra ett typiskt spelbolag måste vara för att kunna förbli lönsamt, även med en marginal på sin sida. Eftersom spelbolagen inte kan dra tillbaka sina odds när spelaren har accepterat dem, måste de vara säkra på att de har minimerat den epistemiska osäkerheten.

Vi kan aldrig veta vad spelbolaget verkligen tror att de ”sanna” oddsen för sina marknader är. Inte heller kan vi veta vad de verkligt sanna oddsen av dessa uppskattningar är. Därför kan vi inte exakt bestämma vilken epistemisk osäkerhet som finns.

Däremot kan vi göra en kvalificerad gissning om vi antar att ett spelbolags stängningsodds (utan marginal) representerar det verkligt sanna oddset. Då kommer oddsskillnaden före och efter stängning att ge ett mått på i vilken utsträckning det fanns modellfel.

Tar man en serie över/under-odds före och efter stängning under den här säsongens fotbollsmatcher i England hos Pinnacle, tar bort marginalen och standardiserar stängningsoddsen till 2,00, är standardavvikelsen i vinstsannolikhet som antagits av oddsen före stängning strax över 2 % . Det ligger i den nedre delen av skalan av mina modellerade standardavvikelser och understryker att Pinnacles modell är ganska effektiv för att minimera den epistemiska osäkerheten.

För att slå den måste spelaren vara minst lika bra och ha asymmetrin på sin sida. Om Pinnacles epistemiska fel är 2 % för dueller med 50 % vinstsannolikhet har spelaren inte mycket till utrymme för förbättring. Spelarna kan självklart vrida saker och ting till deras fördel genom att tillämpa minimigränser för väntevärden innan de väljer att lägga spel hos Pinnacle. Men alla modellkorrelationer kommer att göra uppgiften svårare.

Återigen har vi visat att det inte är lätt att slå ett spelbolag, och i synnerhet inte Pinnacle. Och nu har vi ytterligare en förklaring till varför. Eftersom det är de själva som sätter oddsen har de inte fördelen, som sina kunder, att välja och vraka bland vad som kan vara ett bra spel. De måste sticka ut hakan varje gång och hoppas att de har rätt. För Pinnacle handlar det om att minimera epistemisk osäkerhet och maximera oddseffektiviteten.

Oddsresurser: Bli en bättre spelare

Pinnacles avdelning Oddsresurser är en av nätets mest omfattande artikelsamlingar med spelråd från experter. Vi tillgodoser behoven hos både nybörjare och proffs – vårt mål är helt enkelt att öka våra spelares kunskaper.