close
aug 2, 2017
aug 2, 2017

Slik kan man stille prognoser uten data

Våre tanker om fremtiden er basert på fortiden

Hvor mange pianostemmere finnes det i Chicago?

Superanalytikere og God dømmekraft-prosjektet

De 10 bud for gode prognoser

Slik kan man stille prognoser uten data

Kampen mellom Mayweather og McGregor gjør både sportsfans og tippespillere ville av spenning, om ikke annet så fordi det aldri tidligere har vært noe slikt møte mellom UFC og boksing. Dette gir masse rom for debatt og spekulasjoner, men gjør livet surt for alle som prøver å stille en seriøs prognose for resultatet. Prognoser må nemlig alltid baseres på historiske data, så våre tanker om fremtiden er basert på fortiden. Hva kan så tippespillere gjøre under slike unike omstendigheter? De kan prøve en metode som ble utviklet av en Nobelpris-vinnende atomfysiker.

Prognoser baseres på kvantitative data. Jo flere historiske data du har, desto bedre er sjansene for at du kan danne deg et presist bilde – via et system eller en modell – av hva fremtiden bringer. 

Når noen bygger på eksisterende kunnskap og identifiserer nye, påvirkende faktorer i en fremtidig hendelse basert på datasett, får de sjansen til å lage mer presise prognoser enn det man kan basert på generelt tilgjengelige data. Værmeldinger og langtidsspill på Premier League er gode eksempler på dette.

Når det ikke finnes data, derimot, har vi kun muligheten til å lage kvalitative analyser – å danne begrunnede slutninger om hva som kan skje. Dette virker kanskje ikke stort bedre enn å fukte fingeren og stikke den opp i luften, men vitenskapen har gitt en liten drahjelp, i form av Fermi-metoden.

Enrico Fermi var en anerkjent fysiker, som anses for å være atomalderens far. Han vant Nobelprisen i fysikk i 1938 og lagde verdens første atomreaktor. Han er også kjent for sin tilnærming til det å lage raske anslag for å kvantifisere ting som det anses å være umulig å beregne fordi det ikke finnes nok tilgjengelig informasjon.

Når det ikke finnes data, derimot, har vi kun muligheten til å lage kvalitative analyser – å danne begrunnede slutninger om hva som kan skje. Dette virker kanskje ikke stort bedre enn å fukte fingeren og stikke den opp i luften, men vitenskapen har gitt en liten drahjelp, i form av Fermi-metoden.

Når han underviste i tilnærmingen sin, pleide han ofte å utfordre studentene med merkelige spørsmål som dette:

Hvor mange pianostemmere finnes det i Chicago?

Dette er ikke et lurespørsmål. Tenk på saken noen minutter, og skriv ned et logikkbasert anslag, basert på en rekke underspørsmål med beregninger. På denne måten bør det være mulig å komme frem til et fornuftig svar på hovedspørsmålet (uten å google svaret). Gjør det før du leser videre.

Hvis du stilte disse underspørsmålene (eller brukte en tilsvarende logikk med noe forskjellige spørsmål), ville du klart å komme frem til et rimelig godt anslag for svaret.

  • Hvor mange pianoer finnes det i Chicago?
  • Hvor mange ganger i året blir et piano stemt?
  • Hvor lang tid tar det å stemme et piano?
  • Hvor mange timer i året arbeider en gjennomsnittlig pianostemmer?

Hvis du gjør en gjetning på svaret på de første tre spørsmålene, kan du beregne hvor mange arbeidstimer med pianostemming som utføres i Chicago hvert år. Hvis du deler dette på antall timer en pianostemmer sannsynligvis jobber i året, kan du komme frem til et rimelig anslag på hvor mange pianostemmere som kan leve av dette. Du blir selvsagt nødt til å dele opp spørsmål 1, 2 og 3 i videre underspørsmål for å finne svarene på disse.

For spørsmål én må du gjette befolkningstallet i Chicago basert på kunnskap om befolkningstallet i andre byer i USA. Du gjetter kanskje noe i nærheten av 2–2,5 millioner (det riktige svaret var faktisk 2,7 millioner i 2016).

Deretter må du finne ut hvor mange prosent av befolkningen som har et piano. Et anslag kan være 1 av 100 (omtrent 25 000 hvis du bruker det øvre anslaget for befolkingsstørrelsen). Legg også til en verdi for barer, klubber, skoler osv., du kan kanskje doble antallet til 2 av 100, altså 50 000.

Spørsmål to og tre handler mest om intuisjon, med mindre du har kunnskaper om emnet. Et piano stemmes én gang i året og det tar omtrent to timer. Spørsmål fire kan baseres på din egen erfaring eller på en gjennomsnittlig heltidsjobb med fem arbeidsdager i uken og standard feriedager.

Så hvis du tenker at det finnes 50 000 pianoer som må stemmes én gang i året og det tar to timer å stemme hvert piano, så tilsvarer det 100 000 timer med stemming. Del det på de 1600 timene i året som en gjennomsnittlig pianostemmer jobber, så får du resultatet: Det finnes 62,5 pianostemmere i Chicago.

Det finnes ikke noe definitivt svar, men i telefonkatalogen (takk til Daniel Levitin for innsatsen) teltes det 83, inkludert duplikater. Så hvis du fikk et svar mellom 55 og 70, var det slettes ikke dårlig.

Ikke stress for mye med hvorvidt svaret er presist, det handler mer om metoden du valgte. Denne typen tenking passer godt når du skal lage presise prognoser uten å ha tilgang på data, som ved tipping på Mayweather mot McGregor. Hvis du sliter med å forstå hvordan du skal gå frem i denne situasjonen, bør du lese resten av artikkelen og så prøve et nytt abstrakt spørsmål.

Pianostemmerspørsmålet har for eksempel blitt brukt som spørsmål på jobbintervju for Google for å evaluere evnen til å trekke rasjonelle slutninger, i kombinasjon med andre spørsmål, som "Hvor mye veier Empire State Building?"

Bookmakere drivere ikke med å stille prognoser. De tilbyr rett og slett et mål på hvor sannsynlig det er at noe skjer, presentert som odds. Sånn sett er Pinnacle på tryggere grunn med etablerte sportsgrener som følger faste regler og der det finnes god tilgang på pålitelige historiske data.

Superanalytikere og God dømmekraft-prosjektet

Fermi-metoden blir analysert i Super-Forecasting: The art & science of prediction, en fremfragende bok av Philip Tetlock og Dan Gardner. Boken tar for seg utviklingen som har skjedd innen prognosevitenskap, med God dømmekraft-prosjektet som tema.

I løpet av fire år inviterte Tetlock "20 000 intellektuelt anlagte legfolk" til å bli med i GD-prosjektet og tippe resultatene av en lang rekke geopolitiske spørsmål: Teamet hans var en del av et større prosjekt utført av IARPA (Intelligence Advanced Research Projects Activity), et byrå i USAs etterretningsbransje som jobber med å forbedre standarden på prognosene for kritisk viktige politiske og økonomiske hendelser som påvirker nasjonale interesser direkte.

IARPA arrangerte en prognoseturnering med fem deltagende lag, blant annet GD-prosjektet, som alle var ledet av ledende vitenskapsfolk på feltet. I løpet av fem år stilte IARPA nesten 500 spørsmål, som alle ble besvart på samme tid hver dag.

Presisjonen ble målt i Brier-poeng – svarene ble evaluert ved å summere delta for hvor overbeviste laget var om hvor riktig prognosen var, og kvadratroten av det faktiske resultatet. Ved å kreve at prognosene stilles med en overbevisningsskår både belønner og straffer man selvsikkerhet, så dette er en fin måte å skille mellom deltagerne på.

Bookmakere drivere ikke med å stille prognoser. De tilbyr rett og slett et mål på hvor sannsynlig det er at noe skjer, presentert som odds. Sånn sett er Pinnacle på tryggere grunn med etablerte sportsgrener som følger faste regler og der det finnes god tilgang på pålitelige historiske data.

Deretter kan vi lage modeller basert på hva vi vet har skjedd, og få en god pekepinn på sjansen for fremtidige resultater, presentert som startodds.

For å nå nye kunder og styrke apellen vår blant eksisterende brukere må vi utvide horisonten vår. Det holder ikke bare med vanlige sportsgrener, vi må også tilby nye og marginale sportsgrener, der det ofte finnes lite eller dårlig historikk fra tidligere arrangementer. E-sport, spesialspill og valg er gode eksempler på dette.

Valg skjer så sjelden og under så vidt forskjellige forhold at historiske data er svært lite verdifulle. Meningsmålinger er upålitelige av en rekke årsaker, og nyhetene er et minefelt, så bookmakere mislykkes ofte ved tipping på politikk.

Maiden-paradokset

Et annet godt eksempel på dette er Maiden-løp (førstegangsløp) for hester (Pinnacle tilbyr ikke tipping på hesteløp, det er bare et godt eksempel).

Løp med to år gamle Maiden-hester, der det også deltar hester som aldri har vunnet, er et godt eksempel på tippbare arrangementer der det finnes lite solide data. I tillegg er løpene korte, så det er lite feilmargin hvis hesten får problemer fordi det er første gang de prøver seg på en løpsbane.

Hvordan forutsier man talentet til en hest som aldri har løpt før, i et løp der suksess (fra trenerens/eierens perspektiv) kan handle bare om å gi hesten en positiv løpsopplevelse?

  • Du stiller en serie spørsmål på samme måte som i pianostemmer-problemet.
  • Hvor god er stamtavlen til hesten? Hvor dyktig/vellykket er oppdretteren?
  • Hva med treneren? Har de vunnet førstegangsløp tidligere med andre hester? På hvilke distanser?
  • Hva med jockeyens resultater fra Maiden-løp tidligere?

Disse spørsmålene kan hjelpe deg med å gjøre velbegrunnede gjetninger om hestens vinnersjanser – helst ved å kombinere dem til et rangeringssystem og bruke Brier-poeng til å angi hvor overbevist du er om at anslaget er riktig.

Slik kan denne typen tilsynelatende kompliserte problemer gi en mulighet for tippespillere, siden bookmakerne er i samme båt – om enn beskyttet av en kritisk viktig margin. Vi har ingen modeller eller formler å lene oss på, så traderne våre må basere seg på erfaring, kunnskap og en Fermi-lignende metode.

De 10 bud for gode prognoser

Utfordringene som GD-prosjektet møtte, tilsvarer de utfordringene som tippespillere og bookmakere møter når de beveger seg bort fra tradisjonelle sportsmarkeder og prøver seg på eksotiske spill, altså tilsvarende det vi ser i kampen mellom Mayweather mot McGregor. Vi har en generell forståelse av hvordan man bruker handikap for boksing og MMA hver for seg, men en bokser mot en MMA-utøver gir oss i bunn og grunn et problem av Fermi-typen (tippespillere kan prøve å løse det ved hjelp av live-oddsene og tabellen for oddsbevegelser under).

De gode nyhetene her er at det ble laget noen praktiske problemstillinger basert på funnene fra GD-prosjektet som ble vitenskapelig utviklet for å forbedre grunnprognosene til disse uerfarne "prognosørene".

Tetlock har faktisk satt sammen 10 bud for gode prognoser basert på erfaringene fra GD-prosjektet. Du finner mer informasjon på www.goodjudgementproject.com – eller enda bedre, ved å lese boken. Men her har du et eksempel som er tilpasset for tipping og for kampen mellom Mayweather og McGregor.

Ved hjelp av tilfeldige prøver fant Tetlock ut at de som leste en guidebok som inneholdt disse budene, forbedret  Brier-resultatet sitt med 10 %. Dette kan være det lille ekstra som gir deg fortjeneste på lang sikt som tippespiller.

1 – Fokuser på problemer der det er mer sannsynlig at arbeidet lønner seg, og ignorer både det åpenlyse og det uløselige. Det er svært lite sannsynlig at du kommer til å oppdage noe om Premier League som ikke allerede er kjent i markedet. Finn et realistisk nivå – kalt en Gullhår-sone, etter eventyret om Gullhår og de tre bjørnene – der det er realistisk å anta at du kan finne verdi med rimelig tid og innsats.

2 – Fordel store, kompliserte problemer inn i mindre, enklere spørsmål. For eksempel kan "Hvem vinner kampen mellom Mayweather og McGregor?" bli til "Hvordan er bokseformen til McGregor?" "Hvor motiverte er de?" "Hvilken boksestil har McGregor, og hvordan klarer Mayweather seg vanligvis mot denne boksestilen?", og så videre. Tildel verdier og vurder hvor sikker du er på svarene.

3 – Balanser interne og eksterne synspunkter. Når det gjelder kampen mellom Mayweather og McGregor, handler dette om å ta et steg tilbake og ikke bare tenke kun boksing eller kun MMA. McGregor er enormt populær blant MMA-fansen, som garantert støtter ham i hopetall, men er egentlig innsidekunnskapen deres verdt noe i dette tilfellet? På samme måte, hvor mye vet egentlig boksefanatikere om MMA? Prøv å finne en balanse mellom begge synspunktene.

4 – Finn en balanse mellom over- og underkompensering for ny informasjon. Dette handler om å ta en bayesiansk tilnærming til det å hente inn ny informasjon, men advarer også både mot å overreagere på ny informasjon og mot å ignorere den. Dette handler om erfaring og om å evaluere verdien av informasjonskilden. Det kommer til å bli skrevet nok om denne kampen på nettet til å fylle flere bøker, så det er verdt å ta seg tid til å finne de beste informasjonskildene.

5 – Ikke vær forutinntatt. Hvis du kan mye om boksing og er skråsikker på at Mayweather kommer til å vinne, bør du utfordre deg selv til å tenke på scenarioer der han kan tape, og omvendt.

6 – Uttrykk ideer med sannsynlighetsgrad. En erfaren analytiker vil ha mer detaljerte synspunkter enn "Mayweather vinner garantert" eller "McGregor har ikke en sjanse". De vil diskutere saken med mer nyanserte detaljer, ikke bare med skråsikre uttalelser. 

7 – Lær å finne en balanse mellom for mye og for lite selvtillit. Dette innebærer å finne en balanse mellom å vente så lenge at du går glipp av en mulighet og å hoppe i det med begge bena uten å gjøre en ordentlig analyse først.

8 – Analyser både tabber og suksesser med like stor entusiasme. Det er greit å ta feil, men det er kritisk viktig å innrømme feilen og lære av den. Det er mulig å gjøre alt riktig, men likevel få feil resultat, og omvendt.

 9 – Få frem det beste i andre og la andre få frem det beste i deg. Dette er relatert til lagaspektet ved GD-prosjektet, så det er bare relevant hvis du jobber i et syndikat eller hvis du er veldig aktiv på sosiale medier og villig til å dele arbeidet ditt og motta/gi konstruktiv kritikk.

10 – Forbedringer skjer kun når du gjør alvor av de gode intensjonene dine. Det er flott å tenke på tipping som underholdning, så lenge du ikke forventer å tjene penger på sikt. Hvis du ikke er fornøyd med å ha det gøy, men tape penger, må du bruke tid og krefter på å tippe på en systematisk og strukturert måte.

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.