close
1 15, 2019
1 15, 2019

베팅의 임의성 재논의

불확실성의 근원은 무엇인가요?

실제 베팅 모델로 임의성 시험하기

예측값에서의 편차 계산

베팅의 임의성 재논의
베팅의 임의성을 인식하지 못한 스포츠 베터들은 패배가 확정된 결투에서 싸우는 것과 매한가지입니다. 베팅에서의 임의성을 어떻게 알아채고, 성공이나 실패가 임의성에 얼마나 좌우되는지 어떻게 시험할 수 있을까요? 다음 글을 읽으며 알아보세요.

약 3년 전 피나클에 게제된 제 초창기 기사 중 하나는 베팅의 임의성을 주제로 한 것입니다. 이 기사에서는 해당 주제를 다시 논의하고자 합니다.

물론 베팅은 결과가 중요한 사업이지만, 수익과 손해는 확률의 세계를 기저에 깔고 있습니다. 북메이커의 배당률은 이러한 확률, 즉 무언가가 일어날 가능성을 반영합니다. 베터는 기댓값을 얻을 가능성을 써서 더욱 정확한 확률을 찾으려고 시도합니다.

하지만 피나클의 트레이딩 디렉터 Marco Blume가 최근 피나클이 호스팅하는 베팅 팟캐스트에서 언급하였듯 알 수 있는 건 승리나 패배 뿐입니다. 확률에 관한 자신의 평가가 정확했는지, 그렇지 않았는지 확실히 알 수는 없습니다. 적어도 개별 베팅에서는 그렇습니다.

불확실성의 근원

베팅에 존재하는 불확실성의 근원은 논란의 여지 없이 두 가지로 나뉩니다. 먼저 어쩌면 당신의 예측 모델의 결과에 대한 실제 확률이 유효할지도 모릅니다. 하지만 결과는 둘 중 하나입니다. 운이 좋다면 이길 것이고, 반대라면 질 것입니다. 

프랑스 수학자 피에르시몽 드 라플라스는 운이나 확률은 오직 알지 못하는 지식에 대한 반영일 뿐이라 생각했습니다. 이처럼 임의성은 단지 환상에 불과할지도 모릅니다. 그는 “만약 누군가가 자연계가 돌아가는 모든 법칙과 이를 구성하는 모든 요소의 위치를 알고 있다면, 어느 것 하나 불확실한 게 없을 것이다”라고 한 바 있습니다. 베팅 확률 또한 0 아니면 1로 축소되겠지요. 직관적으로 보자면 이치에 맞는 가설처럼 보입니다. 

만약 당신의 예측보다 더욱 많이 이기거나 진다면, 운이 좋거나 나빴을 수도 있고, 어쩌면 모델이 잘못된 걸수도 있습니다. 아니면 둘 다거나요.

이런 식의 생각이 예측의 정확성을 판별하려고 하는 브라이어 스코어 방법의 기초를 다졌다는 건 부정할 여지가 없습니다. 하지만 실제로는 스포츠 경기와 같은 계의 본질은 복잡하기에, 이를 위해 필요한 데이터 분석을 고려하자면 라플라스의 꿈을 이루는 건 불가능합니다. 카오스 이론에 따르면 초기 조건에 약간의 변화만 있어도 결과는 크게 달라집니다. 정보를 수없이 모아도 확실함을 장담하기에는 부족할 것입니다.

하지만 더욱 중요한 건, 위의 논의는 미시 물리학(분자와 분자보다 작은 입자의 세계)에서는 실질적으로 불가능할 뿐만 아니라 근본적으로 부정된다는 것입니다. 하이젠베르크의 불확정성 원리에 따르면 어떤 것에 대한 위치와 운동량 모두를 완벽하게 알 수는 없습니다. 이 현상은 정보가 부족하기 때문이 아니라 현실의 본질이 그렇기 때문입니다.

만약 지금 어떤 것의 상태를 완벽하게 알 수 없다면 앞으로 어떤 일이 벌어질지 어떻게 예측할 수 있을까요? 어쩌면 원자보다 작은 세계 일이 베팅에서 벌어지는 일과는 크게 연관이 없다는 반론이 나올 수도 있겠군요. 하지만 우리가 보는 세상은 그 작은 세계에서 비롯되기에 꽤나 중요하다고 여겨야만 합니다. 이미 몇몇 과학자는 그렇게 생각합니다.

실질과 이론상의 한계를 고려하면 행운과 불운의 임의성은 분석 중인 자연계 고유의 현상임을 완벽하게 받아들일 수 있을 것입니다. 또한 이런 이유로 ‘진정한’ 비-이원적 확률에 대한 개념을 유용하다 평가할 수도 있습니다.

불확실성의 두 번째 근원은 당신의 예측 모델에 대한 타당성입니다. 어떻게 당신의 확률 평가에 대한 결과가 정확하였는지 그 반대였는지 알 수 있을까요? Marco가 힌트를 주었듯 개별 베팅에서의 승리와 패배만 가지고는 이 질문에 답할 수 없습니다.

2.00 배당률 베팅에 이기면 기분이 좋기야 하겠지만, 그 일이 55%의 확률로 일어났을 거라는 가정이 옳았는지는 알 도리가 없습니다. 만약 이러한 베팅을 천 번 하여 그 중 45%를 이겼다고 하면 어떨까요? 평균적인 측면으로 보았을 때, 당신은 당신의 확률 예측이 잘못되었다는 결론을 내릴 것입니다. 만약 그 중 65%를 이겼다면요? 큰 승리를 거둔 셈이지만 모델은 잘못된 것 아닐까요?

상당한 경우 이 두 불확실성의 근원은 구분할 수 없습니다. 만약 당신의 예측보다 더욱 많이 이기거나 진다면, 운이 좋거나 나빴을 수도 있고, 어쩌면 모델이 잘못된 걸수도 있습니다. 아니면 둘 다거나요. 나머지 기사 지면은 우리 자신의 베팅 이력에 비춰보았을 때 이 모든 게 어떤 의미가 생기는지 돌아보는 데 할애하고자 합니다.

실제 베팅 모델

저를 Twitter에서 팔로우하고 있는 독자 분들은 제 집단 지성에 관한 베팅 시스템을 알고 계실 겁니다. 깔끔한 예측 모델이 되기에는 세련미가 부족한 시스템이긴 합니다. 이 시스템은 단지 베팅 배당률의 정확도 만으로 따지면 피나클이 제일 잘 안다고 가정할 뿐입니다. 그 뒤 마진을 걷어내면 축구 경기 결과의 ‘진짜’ 확률을 반영하는 ‘진짜’ 배당률이라 할 만한게 나온다는 것입니다. 

아이디어는 다음과 같습니다. 베팅 모델은 유효한 베팅 모델이라도 언제나 또는 가끔씩이라도 예상을 만족하며 완벽하게 잘 짜여 있다는 것입니다.

과거 기사들에서 저는 피나클이 항상 옳은 건 아니라는 것을 깨달았습니다. 즉 피나클의 배당률이 완벽하게 효과적이라는 것은 아닙니다. 하지만 수많은 배당률 샘플을 놓고 평균적으로 보자면 상당히 효과적이라는 강력한 증거가 보입니다. ‘진짜’ 배당률을 알 수 있다면 단지 오래 가는 배당률을 찾기만 하면 되는 문제로 귀결됩니다. 만약 그 모델이 오랫동안 유지되었다면 저희가 가진 이점을 통해 수익을 내면 될 것입니다. 데이터를 살펴보죠.

전 2015년 8월에 처음 제안 가치 선택을 냈을 때부터의 데이터는 모두 7,432개이며, 평균 배당률 3.91(최소 1.11, 최대 67.00, 중간값 2.99)에 평균 기댓값이 4.17%(투자 시 104.17%의 수익이 예상됨을 의미)입니다.

아래의 수익 이력은 베팅당 1개 단위 스테이킹 전략을 기초로 한 예측값과 비교했을 때의 실제 성과를 보여줍니다.

revisiting-randomness-in-article-1.jpg

증명이 필요하다면, 실제 수익의 진전을 보면 ‘작다’는 게 실제로는 꽤 크다 할지라도 작은 수 법칙에 따라 크게 잘못된 판단을 내릴 수 있다는 것이 증명됩니다. 보시다시피 그만뒀을 수 있는 지점이 수도 없이 많습니다. 가장 큰 드로다운은 중간 지점에 2천 개가 넘는 베팅에 걸쳐 이어졌습니다. 수많은 등락에도 불구하고, 전체적으로 볼 때는 성적을 따라가며 예측값에 상당히 근접했습니다. 투자 대비 실제 수익은 103.80%였습니다.

즉 평균적으로 볼 때 이 모델은 유효하다고 할 수 있을 것입니다. 그렇지만 단기로 볼 때 이 모델이 항상 제대로 작동하는지는 장담할 수 없을 것입니다. 다만 위에서 설명한 것처럼 결과에서의 행운과 불운의 임의성은 예측 모델의 성적이 기대 이상인지, 이하인지에 따른 임의성과 떼어서 설명할 수 없습니다. 그래도 한번 기대값과 실제 성적의 편차를 한번 살펴보도록 하죠.

예측값에서의 편차 계산

예측값에서 편차를 계산하는 가장 간단한 방법(즉, 베팅 이력 내에서 파란 선에서 빨간 선 사이의 어떤 지점에서라도)은 예측 수익과 실제 수익의 차이를 계산하는 것입니다.

개별 베팅의 경우 그렇게 많은 정보를 제공하지는 않습니다. 결과적으로 이기거나(수익 = 배당률 – 1) 지기(수익 = –1) 때문이죠. 이는 어떤 의미를 가지기에는 종류가 너무 많습니다. 하지만 샘플의 수가 크다면 패턴이 나타나기 시작합니다. 여기 베팅 100번을 시행한 평균 시계열 예측값의 편차 이력을 보시죠.

revisiting-randomness-in-article-2.jpg

굉장히 복잡해 보이지만 100번의 베팅 동안 수많은 성적 이상 및 이하는 ±20%를 초과하였으며, 한 번은 70%를 넘겼습니다.

되풀이하자면 이 변동폭이 얼마나 될지는 알 수 없습니다. 이 모델이 이 시간 단위 동안 보일 모습에서 얼마나 벗어났는지, 행운과 불운에 얼마나 좌우되는지 모르기 때문입니다. 하지만 확실히 말할 수 있는 것은 변동이 아주 많다는 것이며, 짐작건대 이 모든 게 확률에 따라 일어나고 있다는 것입니다. 

더욱 긴 ‘시간’에서 이 현상은 어떤 모습을 보일까요? 같은 걸 1,000번 시행한 평균 차트를 보시죠. 

revisiting-randomness-in-article-3.jpg

당연하게도 천 번의 베팅을 치르는 동안 성적 이상 및 이하에 따른 변동폭과 편차의 요동이 줄어들었습니다만, 여전히 고려할 만큼은 관찰됩니다. 1,000번의 베팅 동안 최고 성적 이상은 15%이며, 최하 성적 이하는 -11%입니다.

이런 편차가 나타날 확률은 어떻게 될까요? 만약 동전을 100번 던진다고 가정하면 앞면이 50번, 뒷면이 50번 나오는 게 가장 정확할 것이라 예상합니다. 앞면이 40번, 뒷면이 60번 나오거나 이와 반대인 확률을 계산하는 것도 간단한 편입니다. 베팅 이력에도 이를 똑같이 적용할 수 있습니다.

예측값에 따른 편차의 확률을 계산할 때 저는 t 검정 근사치를 이용하지만, 몬테카를로 시뮬레이션을 사용해도 됩니다. 저는 두 방법을 모두 사용했으며 결과는 동일했습니다. 먼저 100번의 베팅 시계열 평균입니다. 확률은 x번 시행했을 때 1번으로 표현했으며 단위는 로그입니다.

revisiting-randomness-in-article-4.jpg

역시 여러 종류의 결과가 보이며 종종 보기 힘든 편차도 관찰됩니다. 100번 베팅 샘플의 예측값에서의 편차에서는 100번에 한 번 관찰되는 값도 여러 번 발견되었습니다. 샘플 하나는 5천 번에 한 번 꼴로 나타나는 편차를 보였으나, 이는 거의 대부분이 임의성 때문에 일어난다는 것이라는 개연성이 있습니다.

1,000번 시행한 평균 차트를 보시죠.

revisiting-randomness-in-article-5.jpg

아이디어는 다음과 같습니다. 베팅 모델은 유효한 베팅 모델이라도 언제나 또는 가끔씩이라도 예상을 만족하며 완벽하게 잘 짜여 있다는 것입니다. 대부분은 그렇지 않으며 상당수는 꽤 그러합니다. 

물론 날카로운 베터들은 베팅은 장기적인 평균값이야말로 모든 것인 장기전이라는 것을 알고 있습니다. 이들은 행운과 불운 또는 짧은 기간에 적용된 불완전한 모델에 따른 임의성의 시기를 견뎌냅니다. 제 임의성에 관한 첫 기사처럼 제가 다시 한 번 이러한 기간은 10번, 100번뿐만 아니라 1,000번의 베팅으로도 측정이 가능하다는 것을 명확히 밝혔기를 바랍니다.

베팅 정보 - 베팅 지원

피나클의 베팅 정보는 온라인의 모든 전문가 베팅 조언 중 가장 광범위한 콜렉션입니다. 모든 경험 수준에 맞추어서 피나클의 목표는 단 하나, 베터가 더 풍부한 지식을 함양하도록 지원하는 것입니다.