close
okt 18, 2017
okt 18, 2017

Att bedöma spelskicklighet: Bayesianska kontra frekventistiska metoder

Hur kan man själv bedöma hur bra man är på att spela?

Vad är skillnaden mellan bayesianska och frekventistiska metoder?

Hur fungerar grader av slumpmässighet och förväntad skicklighet?

Att bedöma spelskicklighet: Bayesianska kontra frekventistiska metoder

I grund och botten krävs det två saker för att kunna tjäna pengar på odds. Skicklighet och tur. Turens påverkan förbises ofta, men det är också vanligt att inte mäta skicklighetens roll. Denna artikel visar varför det är viktigt att kunna bedöma spelskicklighet med olika metoder och hur resultat kan skilja sig beroende på förhållningssätt.

Bayes teorem kan användas för att göra bättre förutsägelser när man spelar på odds. Du kan också använda den för att få ett bättre uppfattning om hur bra du faktiskt är på att förutspå resultat och hitta positiva väntevärden. Jag har tidigare undersökt hur man bäst utvärderar en spelhistoriks kvalitet med hjälp av ett frekventistiskt tillvägagångssätt (t-test). Denna artikel kommer att jämföra och kontrastera de två metoderna.

Grader av tilltro

Inom sannolikhetslära beskriver Bayes teorem risken för att en händelse inträffar förutsatt att en annan händelse också inträffar. Ponera till exempel att jag tror att jag har 50 % sannolikhet att vara en skicklig spelare som kan hitta värde. Om jag vinner mitt nästa spel, hur påverkar det min tro på min egen förmåga? Med andra ord: hur påverkar ett vunnet spel sannolikheten för att jag är en skicklig spelare? 

Bayes teorem tolkar sannolikheten som en "grad av tilltro" i en hypotes och formaliserar det matematiska förhållandet mellan den tidigare graden av tilltro innan beviset blivit känt (apriorisannolikheten) och graden av tilltro efter att beviset blivit känt (aposteriorisannolikhet). Det anges så här:

{ekvation} - P(A|B)= P(A)*P(B|A)/P(B)

I vårt exempel är:

P(A) = apriorisannolikheten för att jag är en skicklig spelare

P(B) = apriorisannolikheten för att mitt spel ska vinna

P(B|A) = sannolikheten att jag vinner mitt spel förutsatt att jag är en skicklig spelare.

P(A|B) = sannolikheten att jag är en skicklig spelare förutsatt att mitt spel vinner.

Låt oss ta ett exempel. Vi antar att definitionen av en skicklig spelare är förmågan att konsekvent kunna uppnå en avkastning på 110 %. Vid spel på jämna odds skulle det innebära att man vann 55 av 100 spel. Därmed är P(B|A), det vill säga sannolikheten att jag vinner mitt spel förutsatt att jag är en skicklig spelare, 55 %.

Sannolikheten att en oskicklig spelare vinner motsvarande spel, det vill säga P(B), är 50 %. Låt oss anta att jag tror att jag har 50/50 chans att vara skicklig {P(A) = 50 %}. Då blir P(B) 52,5 % (halvvägs mellan 50 % och 55 %).

Världens bästa handikappspelare är kapabla till omkring 57 %. När spelbolagsmarginalen räknats bort blir avkastningen cirka 110 %.

Om jag vinner mitt spel och matar in dessa siffror i Bayes teorem blir aposteriorisannolikhet, det vill säga P(A|B), 52,38 %. Om mitt spel vinner får det mig att tro att sannolikheten att jag är skicklig är större än tidigare.

Bayes teorem kan appliceras iterativt. Efter att ha vunnit mitt första spel och uppdaterat sannolikheten för att jag är en skicklig spelare spelar jag nu en gång till. Aposteriorisannolikheten som beräknas i det första steget blir den nya apriorisannolikheten.

Den nya aposteriorisannolikheten för att jag är en skicklig spelare kommer nu att vara villkorad av att jag vinner (eller förlorar) mitt nästa spel. Om jag vinner ökar återigen sannolikheten för att jag är skicklig – om jag förlorar kommer den att minska. Om jag vinner mitt andra spel i det här exemplet ökar sannolikheten för att jag är en skicklig spelare till 54,75 %. 

Denna process kan upprepas utan begränsning – varje uppdaterad villkorlig sannolikhet faller någonstans mellan 0 % och 100 %. Jag har kört denna iteration 1 000 gånger, det vill säga 1 000 spel, och diagrammet nedan visar resultathistoriken (blå linje) tillsammans med de bayesianska sannolikheterna för att jag är en skicklig spelare efter varje spel (röd linje).

assessing-skill-In-article-1.jpg

Ett signifikant problem med en bayesiansk tolkning av sannolikheten är att stark förkunskap eller tro på vissa utfall eller förutsättningar krävs. Men har vi verkligen det när vi bedömer sannolikheten för att jag är en skicklig spelare? Mitt val i det här exemplet, 50 %, var rent godtyckligt och inte baserat på något annat än en gissning. Se vad som händer om jag nu ändrar den ursprungliga apriorisannolikheten till 1 %. 

assessing-skill-In-article-2.jpg

Dessutom är det helt godtyckligt vad "skicklig" faktiskt betyder i det här sammanhanget. Förmodligen är en spelare som kan uppnå 105 % avkastning efter 10 000 spel skicklig. Du kan läsa om vikten av urvalsstorlekar i De små talens lag. Det är också oklart hur man ska definiera P(B) för varje iterativt steg, givet ett uppdaterat värde för P(A). 

I min bayesianska modell antog jag helt enkelt ett linjärt förhållande, det vill säga att om P(A) är lika med 0 %/20 %/40 %/60 %/80 %/100 % så är P(B) lika med 50 %/51 %/52 %/53 %/54 %/55 %, men giltigheten är långtifrån säker. Med tanke på att en individ vars grundläggande vinstsannolikhet per spel är 52,5 % uppenbart är skicklig (bara inte lika skicklig som en med 55 %) mäter vi grader av skicklighet snarare än en binär skicklighetssannolikhet. 

Trots det ger denna grafiska representation av utvecklingen av bayesiansk sannolikhet ett visst intuitivt mått på sannolikheten för (eller graden av) en spelares förmåga att konsekvent gå med vinst och hur det kan förändras över tid.

Grader av slumpmässighet

Medan den bayesianska metoden fokuserar på sannolikheten för en hypotes (att jag är en skicklig spelare eller inte) med en fast uppsättning data (vinster och förluster), fokuserar frekventistmetoden däremot på sannolikheten (eller frekvensen) för de data som matas in i hypotesen. Här är hypotesen fastställd (sannolikheten för att jag är skicklig är antingen 100 % eller 0 %) medan data antas vara slumpmässiga. 

Sannolikheten att man är skicklig kommer bara att ha stigit från 1 % till 20 % efter 1 000 spel.

Vanligtvis börjar det frekventistiska tillvägagångssättet med nollhypotesen – att jag inte är skicklig och att mina spelresultat bara beror på slumpen. Sedan görs ett försök att beräkna sannolikheten (vanligtvis kallat p-värdet) med hjälp av statistik som visar att de data vi har observerat (i det här fallet mina vinster och förluster) kunde ha inträffat förutsatt att nollhypotesen var sann.

Slutligen jämförs denna sannolikhet med ett acceptabelt signifikansvärde (ibland kallat α-värdet) så att nollhypotesen, om p < α (vanligen 5 % eller 1 %), avvisas till förmån för den giltiga.

Den statistik som jag tidigare har granskat i Pinnacles Oddsresurser är t-poäng, som fått sitt namn från studentens t-test för statistisk signifikans. Förutsatt att oddsen är rättvisa kan t-poängen approximeras av: 

där n = antalet spel, r = avkastningen (uttryckt som ett decimaltal) och o = de genomsnittliga decimaloddsen. T-poängen omvandlas till ett p-värde med hjälp av statistiska tabeller eller en online-kalkylator. I Excel kan man använda TDIST-funktionen. Låt oss applicera detta på vår hypotetiska spelhistorik.

I diagrammet nedan jämförs de ursprungliga tidsserierna för den utvecklande bayesianska sannolikheten, det vill säga att jag är en skicklig spelare med en ursprunglig tro på att sannolikheten för det var 50 % (röd linje), med utvecklingen av frekventistiskt p-värde – sannolikheten för att det jag har uppnått kan ha inträffat av en slump förutsatt att jag inte har någon skicklighet alls (grön linje) med hjälp av ett t-test med två svansar och ett urval.

assessing-skill-In-article-3.jpg

På ett allmänt kvalitativt plan är de två linjerna sina raka motsatser, men det är troligen främst ett resultat av slumpen. Man bör emellertid inte tolka detta som att p-värdet mäter sannolikheten för att vara oskicklig, och att 1-p därför är lika med sannolikheten för att vara skicklig.

Bayesianska och frekventistiska analyser är, om inget annat, en påminnelse om att man måste tänka långsiktigt för att kunna gå med vinst på odds.

Om sannolikheten för att ens spelhistorik inträffat av en slump är 5 % betyder inte det per automatik att sannolikheten för att spelhistoriken uppstod till följd av skicklighet är 95 %. Det betyder bara att det vi har observerat kan förväntas inträffa i 5 % av fallen förutsatt att nollhypotesen (att slumpen styr helt och hållet) är sann.

Nackdelen med det frekventistiska tillvägagångssättet är att det behandlar sanning som binär. I motsats härtill anser den bayesianska metoden implicit att sanningen är probabilistisk, preliminär och alltid falsifierbar. Trots denna brist utgör frekventistisk hypotesprövning ett lika användbart verktyg för att analysera en spelhistorik och undersöka om det är troligt att den uppstått på grund av något annat än slumpen.

Hur står sig de frekventistiska och bayesianska modellerna mot varandra om den senare har en tidigare tilltro på bara 1 % (i stället för 50 %) att jag är skicklig?

assessing-skill-In-article-4.jpg

I det här fallet är det tydligt att vårt t-test kommer att uppmuntra till övertro på den egna förmågan jämfört med det bayesianska tillvägagångssättet som är mycket mer konservativt.

Detta belyser ytterligare hur känslig den bayesianska metoden är för tidigare uppfattningar. Efter nästan 700 spel under dessa omständigheter kan vårt t-test visserligen berätta att vår spelhistorik bara har 3 % sannolikhet att ha uppstått på grund av slumpen, men Bayes teorem tyder på att det fortfarande finns mindre än 10 % chans att vi är tillräckligt skickliga för att leverera 110 % avkastning på lång sikt.

Eftersom jag inte är någon risktagande spelare skulle jag föredra den mer konservativa aprioriuppfattningen om min förmåga – jag bör alltid börja med att anta att jag har liten eller ingen skicklighet alls såvida jag inte har goda skäl att tvivla på det.

Sannolikheter för förväntad skicklighet

Analysen ovan är bara ett exempel på en spelserie med en hypotetisk avkastning på 110 %. För den visuella tydlighetens skull valde jag medvetet en spelhistorik som gjorde det möjligt för mig att förmedla de koncept jag ville diskutera.

För att få en mer detaljerad bild av förväntan, det vill säga vad vi kan förvänta oss att se i genomsnitt, bör vi köra modellen många gånger. Alla som är förtrogna med Pinnacles Oddsresurser vet att vi kan göra detta med hjälp av en Monte Carlo-simulering.

Det första diagrammet nedan visar en Monte Carlo-simulering av hur den bayesianska sannolikheten för att jag är en skicklig spelare utvecklas. Simuleringen har körts 10 000 gånger för tio hypotetiska vinstfrekvenser: 51 % till 60 % med enprocentiga intervaller (motsvarande väntevärden på 102 % till 120 % med tvåprocentiga intervaller med jämna odds).

Kurvorna har framtagits genom beräkning av medianvärdet av bayesiansk sannolikhet efter varje sekventiellt spel (1 000 spel totalt) som för detta ändamål ger en bättre bild än medelvärdet (där låga och höga värden kan förvränga tolkningen). 

Den initiala aprioritilltron till min skicklighet {p(A)} antas vara 1 %. Föga förvånande kan man konstatera att ju högre min hypotetiska vinstfrekvens (och väntevärde) är, desto snabbare kommer tron på min förmåga att närma sig 100 %. (Ju mörkare kurvan är desto högre är den förmodade vinstfrekvensen.) 

assessing-skill-In-article-5.jpg

Världens bästa handikappspelare är kapabla till omkring 57 %. När spelbolagsmarginalen räknats bort blir avkastningen cirka 110 %. Detta diagram illustrerar att det krävs uppemot 1 000 spel för att fastställa en stark och meningsfull tilltro till din egen förmåga, förutsatt att du inte tidigare trodde att du besatt någon nämnvärd förmåga. 

Om du däremot upptäcker att du vinner i 54 % av fallen när du spelar på jämna odds tar det mycket längre tid att uppnå en statistiskt solid tilltro till att du är skicklig. Sannolikheten att man är skicklig kommer bara att ha stigit från 1 % till 20 % efter 1 000 spel. 

Det slutliga diagrammet visar en liknande uppsättning idealiserade förväntade p-värden från samma spelserie och samma tio hypotetiska vinstfrekvenser. Eftersom vi har en ekvation för att approximera t-poängen för vilken kombination av spelantal, avkastning och odds som helst krävs ingen Monte Carlo-simulering. Som sagt: ju mörkare kurvorna är desto större är den förmodade vinstfrekvensen (från 51 % till 60 %).

assessing-skill-In-article-6.jpg

Med en vinstfrekvens på 57 % uppnås statistisk signifikans (p-värde <5%) efter bara 200 spel, och starkare statistisk signifikans (p-värde <1%) uppnås efter cirka 335 spel. Denna information säger emellertid ingenting om hur skicklig man är på att spela, utan anger bara sannolikheten för att spelhistoriken inträffat av en slump förutsatt att ingen skicklighet alls föreligger. 

Dessutom baseras dessa grader av statistisk signifikans, liksom de initiala bayesianska apriorisannolikheterna, inte på mycket mer än subjektiv bedömning. Men så länge man är medveten om dessa brister bör statistisk prövning med p-värde, i likhet med den bayesianska modellen, utgöra en användbar metod för att bedöma sin egen förmåga att konsekvent hitta positiva väntevärden.

Bayesianska och frekventistiska analyser är, om inget annat, en påminnelse om att man måste tänka långsiktigt för att kunna gå med vinst på odds. Anta aldrig att några få vinster räcker för att avgöra att du vet vad du håller på med.

Oddsresurser: Bli en bättre spelare

Pinnacles avdelning Oddsresurser är en av nätets mest omfattande artikelsamlingar med spelråd från experter. Vi tillgodoser behoven hos både nybörjare och proffs – vårt mål är helt enkelt att öka våra spelares kunskaper.