베팅을 통해 장기적 이윤을 확보하려면 베팅 시스템이 필수적입니다. 하지만 베터는 결과에 대해 상관관계와 인과관계만큼이나 자금 관리와 베팅 시스템을 혼동합니다. 베팅 시스템이란 무엇이며 상관관계와 인과관계의 차이는 어떻게 알 수 있을까요? 다음 내용을 읽으면서 알아보세요.
베팅 시스템이란 무엇인가요?
베팅의 기본 금액 규모를 정하는 방법인 스테이킹 방식이나 자금 관리 전략에 비해 스포츠 베팅 시스템은 북메이커의 이윤 마진을 뛰어넘고 긍정적인 기대값을 찾도록 과거 데이터의 정량 분석을 기반으로 한 구조적 예측 시스템입니다.
- 베팅 마진을 계산하는 방법을 알아보세요.
베터들은 종종 자금 관리와 베팅 시스템을 혼동합니다. 구글에서 '베팅 시스템'을 검색하면 가장 많이 나오는 전략은 Martingale(마틴게일), Labouchere(라부쉐르), Fibonacci(피보나치) 등이지만 이는 완전 다른 개념입니다.
자금 관리는 단순히 베팅에 관련된 위험의 특성을 바꾸는 것입니다. 하지만 패배 예측 방법을 장기적으로 승리 예측으로 바꿀 수는 없습니다. 그에 비해 베팅 시스템은 스포츠 경기에서 '실제' 일어날 가능성에 더욱 집중합니다.
스포츠 베팅 시스템: 회귀 분석
스포츠 베팅 시스템을 설계하는 데 가장 광범위하게 사용되는 방법은 통계 회귀 분석입니다. 통계 용어에 익숙하지 않은 독자는 이해하지 못할 수도 있겠지만 이는 그저 변수 사이의 관계를 측정하는 방법일 뿐입니다.
회귀 분석이 베팅 시스템 설계에 유용한 도구로 사용된다고 할 때 약점은 상관관계와 인과관계 사이를 구분하지 못한다는 것입니다.
두 요인만 고려하는 단순 선형 회귀에서 이에 대한 가장 간단한 예는 팀이 득점하는 골 수(예측 또는 독립 변수)와 경기 우승 빈도(응답 또는 의존 변수)를 두 요인으로 설정하는 것입니다.
필자의 첫 번째 책인 고정 배당률 스포츠 베팅: 통계적 예측 & 위험 관리(Fixed Odds Sports Betting: Statistical Forecasting & Risk Management)에서 지난 6번의 경기 동안 두 팀의 상대적 골 우위를 기반으로 단순한 회귀 모델을 논했습니다.
큰 규모의 경기 샘플을 사용하여(이 경우 1993년부터 2001년까지 8시즌) 각 경기 결과의 빈도와 함께 경기 순위 계산(홈팀의 6경기 골 득점차 - 원정팀의 6경기 골 득점차)에 연관이 있는 차트를 만들 수 있었습니다. 경기 순위 분산(독립 변수) 대 홈 우승 빈도(의존 변수)는 아래에서 볼 수 있습니다.
차트에 있는 각 데이터 포인트가 조금 분산되어 있기는 하지만 다음 두 가지 변수와 관련된 확실한 선형 경향을 볼 수 있습니다. 지난 6경기에서 원정팀에 비해 상대적으로 홈팀의 골 득점차가 더 나을수록 홈팀이 경기에서 우승할 확률이 더 높았습니다.
차트에 그려진 회귀 선은 본질적으로 불필요한 정보나 임의적인 행운/불운을 제거한 상대적 골 우위와 홈 우승 빈도 간의 이상적 관계를 잘 묘사하고 있습니다.
앞서 얘기한 선은 등식을 통해 설명할 수 있습니다. 단순한 선형 회귀 모델로써 y = mx + c의 형태인데, y는 의존 변수(우승 확률), x는 독립 변수 및 경기 순위, m은 경향 선의 기울기 혹은 경사(관계의 강함 정도)이며 c는 선이 y축과 만나는 지점의 상수(예를 들어 x=0)를 뜻합니다. 이 예시에서 등식은 다음과 같이 성립합니다.
홈 승률 % = (1.56 x 경기 순위) + 46.5
경기 순위가 0일 때(홈과 원정팀이 골 득점차에서 더하거나 덜함 없이 동등할 때) 승률은 46.5%가 됩니다. 직감적으로 말이 되는 것처럼 보이는데 축구 경기의 46%가 실제로 홈팀 승리로 마무리됩니다. 지난 6경기 동안 홈팀의 골 득점차가 원정팀의 골 득점차보다 10점이 높으면 회귀 모델에서 이 팀의 승률을 62%로 계산합니다. 20점이 높으면 78%로 더욱 높아집니다.
회귀 분석은 또한 베팅 시스템 모델을 통해 승리 빈도에서 변수가 어느 정도 설명되고 있는지를 알려줍니다. 이 경우에는 86%입니다. 데이터에 일치하는 경향 선을 통해 이를 확인할 수 있습니다. 경향 선은 두 변수 사이에 얼마나 강력한 상관관계가 있는지 보여줍니다.
베팅 예측을 하기 위해 사용하는 시스템
회귀 모델을 완벽히 작동하는 베팅 시스템으로 구축하기 위해서는 미래 경기에 대해 예측을 하고 긍정적인 기대값을 가져오는 베팅을 찾아낼 필요가 있습니다.
자금 관리는 단순히 베팅에 관련된 위험의 특성을 바꾸는 것입니다. 하지만 패배 예측 방법을 장기적으로 승리 예측으로 바꿀 수는 없습니다.
대부분의 모델 방법과 마찬가지로 표준 예측은 과거는 미래의 열쇠라는 개념에 기반을 둡니다. 경기 순위 +10인 팀과의 경기가 홈 승률 62%로 종료됐다면 이를 통해 얻을 수 있는 예측은 골 득점차 10점 우위인 홈팀이 경기에서 이길 확률이 62%라는 뜻입니다.
- 더 보기: 과거 경기력이 성공의 지표가 아닌 이유
이제는 이러한 확률을 '실제' 확률로 변환하고 더 나아가 장기적 가능성을 제안하는 북메이커의 기대값을 구할 수 있습니다. 2001/02 English Football League 시즌에 이 모델을 적용하여 가장 좋은 홈 승률 베팅 배당률일 때 526개의 베팅에서 +2.1% 이상의 이윤을 남길 수 있었으며, 만약 맹목적으로 모든 홈 경기에서 이긴다고 단순히 베팅했으면 -3.7%의 손실을 보았을 것입니다.
상관관계 vs. 인과관계
한 시즌 동안 500개 이상의 베팅을 한다고 해서 수익성이 시즌마다 재현된다는 보장은 없습니다. 신뢰할 수 있는 베팅 시스템을 확실하게 하는 적절한 숫자로 보일 수도 있으나 베팅 정보 독자라면 그렇지 않다는 것을 잘 알 수 있습니다.
작은 수 법칙에 대한 피나클의 기사는 심지어 베팅 샘플 크기가 1,000개여도 사실상 인과관계에 기반하지 않으며 단지 우연히 발생하는 허위 수익성 패턴을 보여준다는 것을 상기시킵니다. 안타깝게도 다음 다섯 시즌은 이 베팅 시스템을 사용하여 모두 손해를 보았습니다.
단순한 골 우위 회귀 모델이 어느 홈팀이 보다 이길 가능성이 높은지를 찾아내기는 했지만 북메이커의 배당률이 암시한 확률보다 더 승률이 높은 팀을 찾아낼 수 있을 것이라는 보장을 할 수는 없었습니다.
안타깝게도 많은 스포츠 베터들이 베팅 역사를 공부할 때 예측, 정확도, 타당성을 잘못 이해해서 그 과정 중에 상관관계와 인과관계를 혼동하게 됩니다.
저의 모델은 예측에는 적합했으나, 북메이커가 배당률을 설정하는 데 사용한 모델이나 다른 베터가 북메이커의 배당률을 형성하고 변경하는 데 사용한 모델보다 나아 보이지 않았습니다.
제 모델이 단순히 북메이커의 모델을 복제한 것이라면 수익성이 지속되지 않았을 것이며 예측할 수 없는 임의성만을 보여줬을 것입니다. 타당한 상관관계를 기반으로 하지 않은 것처럼 나타났습니다. 제 모델 예측은 다른 예측 모델보다 정확하지 않았으므로 이러한 이익을 '창출하지' 못했습니다.
정밀도 vs. 정확도
물론 2인자 선형 회귀 모델이 기대값을 찾을 수 있는 가장 정교한 베팅 시스템이라고 보기는 어렵습니다. 더 많은 독립/의존 변수가 있는 다중 회귀 모델은 조금 더 정밀한 예측이 가능합니다. 그러나 분석가는 그로 인해 정확도가 떨어지지 않는다는 사실을 예의주시해야 합니다.
정밀한 모델은 단순한 선형 회귀 모델의 경향 선과 같이 측정치가 서로 가까이 위치하고 있습니다. 하지만 정밀도가 반드시 정확도를 보장하는 것은 아닙니다. 정확도는 '참' 값에 얼마나 근접한지에 대한 척도입니다. 정밀도는 무작위 오차와 관련되며 정확도는 계통 오차(또는 편향이라고 함)와 관련됩니다.
베팅 시스템이 유효하려면, 다시 말해 지속적으로 수익성 있는 기대값 찾기 등 원래의 목적을 이루도록 하려면 반드시 정밀하고 정확해야 합니다. 유효성은 예측성과 지속성을 모두 나타내는 것으로 우리가 원인이라고 생각하는 것이 진짜 원인인지, 측정 결과가 반복적으로 그 결론을 가리키는지를 의미합니다.
안타깝게도 많은 스포츠 베터들이 베팅 역사를 공부할 때 예측, 정확도, 타당성을 잘못 이해해서 그 과정 중에 상관관계와 인과관계를 혼동하게 됩니다. 이러한 오류는 대부분 행운으로 인해 발생한 수익이 베팅 시스템으로 인한 '결과'라고 믿기 때문에 생깁니다.
회귀 분석의 함정
회귀 분석이 베팅 시스템 설계에 유용한 도구로 사용된다고 할 때 약점은 상관관계와 인과관계 사이를 구분하지 못한다는 것입니다. 회귀 분석은 변수 간 관계를 알아내기에 효과적입니다. 골 득점/실점 대 승리 경기 가능성을 예로 들 수 있는데 한 변수가 다른 변수를 야기한다면 값을 정할 수가 없습니다.
회귀 분석은 Barcelona가 패배하면 Lionel Messi가 득점하지 못한 사실을 보여줄 수도 있습니다. 그러나 Lionel Messi가 득점하지 못한 것이 Barcelona의 패배 원인이었다고 결론을 내릴 수는 없습니다.
베팅 시스템에 인과관계나 유효성을 구축하지 않으면 다른 모든 사람들이 사용하는 예측 모델과 다를 것이 하나도 없다는 사실을 깨달아야 합니다. 스포츠 베팅과 같은 상대성 기술에서 단지 미래를 예측하는 것만으로는 수익을 낼 수 없으며 다른 누구보다 예측을 잘 해야 합니다.