11 2, 2015
11 2, 2015

제한된 데이터에 대해 부트스트래핑하는 방법

제한된 데이터에 대해 부트스트래핑하는 방법
시즌이 시작되었고 믿을 만한 결론을 구상할 데이터가 충분하지 않은 경우 어떻게 하시나요? 이 기사에서 Dominic은 두 가지 예제를 제공하여 소규모 샘플링으로 인한 매개 변수 오류의 효과를 최소화하기 위해 부트스트래핑을 사용하는 방법에 대해 설명합니다.

이전 Pinnacle 기사에서 설명한 대로 미식 축구에 대한 경기 기대값을 개발하는 데 사용되는 주요 방식은 푸아송 분포입니다. 푸아송 분포를 사용하여 축구 베팅 승자를 예측하는 방법에 대한 자세한 내용을 여기에서 알아보십시오.

기본적으로 홈 팀의 공격 능력과 어웨이 팀의 방어 능력에 따라 예상되는 평균 득점이 홈 팀에게 할당됩니다.  예상되는 평균 득점은 어웨이 팀에게도 지정됩니다.

그러나 시즌을 시작할 때 이 방법을 사용하면 샘플링할 경기가 충분하지 않다는 문제가 있습니다. 여기에 더해 치열한 경기를 경험한 경우, 예를 들어 득점이 많았던 경기나 골 없이 죽 이어졌던 경기들이 예측에 큰 영향을 미칠 수 있습니다.

실제로 심각한 매개 변수 오류가 발생하게 됩니다. 스포츠 베팅 모델을 구축하는 방법에 대한 자세한 내용은 여기에서 볼 수 있습니다.

매개 변수 오류의 금액을 측정하기 위해 제안하는 방법은 부트스트래핑 기법을 사용하는 것입니다. 부트스트래핑은 샘플링 크기를 고안한 방법과 관련됩니다.

기록 당시 최고의 Premier League 팀이 각각 홈 경기 5번과 어웨이 경기 5번 이하를 소화했습니다.

예를 들어 두 가지 방법을 권장할 수 있습니다.

방법 1: 직접적인 접근 방식

이 방식은 대체를 가진 샘플링과 관련이 있습니다. 예를 들어, 동일한 값을 한 번 넘게 선택할 수 있도록 비슷한 샘플링 크기를 만듭니다.

Aston Villa, West Ham, Arsenal 및 Crystal Palace를 상대로 각각 3점, 2점, 2점 및 1점을 득점한 시기를 찾기 위해 Leicester City의 홈 경기를 선택합니다. 이 샘플에서 경기당 홈 팀이 평균 2골을 기록합니다. 

제 이 값을 사용하여 4골에 대한 다른 무작위 샘플을 만들어 봅시다. 이 방법은 몬테 카를로 시뮬레이션에서 무작위 값을 만드는 것과 비슷합니다. 추가 샘플 세트는 다음과 같을 수 있습니다.

  •       샘플 1: 2,2,2,1
  •       샘플 2: 1,1,3,2
  •       샘플 3: 3,3,2,2
  •       샘플 4: 1,2,1,1

매 무승부마다 1골이나 3골로 무승부가 되는 것보다 2골로 무승부가 될 가능성이 2배 많아야 하고, 각 경우에서 다른 평균을 가질 수 있습니다. 즉 항상 2가 아닙니다.

이 경우 샘플당 평균은 각각 1.75, 1.75, 2.5 및 1.25입니다. 평균이 2라고 생각하지만 값은 1.25에서 2.5 사이가 될 수 있음을 보여줍니다.

또한 서로 다르게 부트스트래핑한 상당수의 샘플을 계산하고 결과의 표준 편차를 확인하여 이를 확장할 수도 있습니다.

방법 2: 제대로 즐기기

Leicester의 경기에서는 기대 점수를 생성할 수 있었습니다. 푸아송 방법과 비슷한 방식으로 생성할 수 있지만 이전 시즌의 데이터를 사용합니다.

예를 들어 Aston Villa와의 경기를 살펴 보겠습니다. Premier League에서 2014/15년에 득점한 평균 홈 경기 골은 1.474였습니다. Leicester는 19번의 홈 경기에서 28골을 득점했고, 반면에 Aston Villa는 19번의 어웨이 경기에서 32골만 허용했습니다.

이 결과로 인해 Leicester의 공격력이 1이 됩니다. 즉, 홈에서는 일반적인 팀과 비슷합니다. 반면 Aston Villa는 평균 1.684골을 허용했습니다.

이 숫자를 1.474로 나누면 114.29%가 나오는데, 이는 Aston Villa가 어웨이 경기를 할 때 평소보다 14% 더 많은 골을 허용한다는 것을 의미합니다. 그러므로 Leicester는 홈에서 Aston Villa를 상대로 평균 1*1.1429*1.474 = 1.684골의 득점을 기대할 수 있습니다. 

모든 경기에 동일한 프로세스를 반복하여 얻은 경기당 득점하는 골의 기대치는 아래 표와 같습니다. 여기에서 Leicester가 Crystal Palace를 상대로 하는 경기를 제외하고 기대치를 상회하는 득점을 한다는 것을 알 수 있습니다.

이는 차이라는 이름의 행에 표시됩니다. 차이의 기술적인 용어는 오차입니다.

Aston Villa West Ham Arsenal Crystal Palace
예상 골 1.684 1.526 1.158 1.263
실제 골 3 2 2 1
차이 1.316 0.474 0.842 -0.263

방법 1과 비슷한 방식으로 이제 일부 오차를 대체하는 샘플을 사용할 수 있습니다. 일부 가능한 샘플링 오차는 다음과 같습니다.

  •       샘플 1: 1.316, 1.316, 0.474, 0.474
  •       샘플 2: 0.474, -0.263, -0.263, 0.474

이제 이러한 샘플 오차를 예상 점수에 추가하여 다른 홈 경기 골 득점의 샘플을 얻을 수 있습니다.

  •       샘플 1: 3.000, 2.842, 1.632, 1.737
  •       샘플 2: 2.158, 1.263, 0.895, 1.737

각 샘플에는 자체적인 평균이 있으며, 이를 사용하여 다른 매개변수에 대하여 홈 팀이 득점한 평균 골 수를 계산할 수 있습니다.

결론

정확히 말해 간단한 계산 방법은 아니지만 광범위한 프로그래밍 지식이 필요하지 않습니다. 스프레드시트를 사용하여 가능한 매개변수 범위를 테스트할 수 있습니다. 위에서 설명한 두 번째 방법을 사용하는 경우 어웨이 팀이 득점하는 예상 골 수에 대한 오차를 분석해야 합니다. 

strategy-openaccount.jpg

베팅 정보 - 베팅 지원

피나클의 베팅 정보는 온라인의 모든 전문가 베팅 조언 중 가장 광범위한 콜렉션입니다. 모든 경험 수준에 맞추어서 피나클의 목표는 단 하나, 베터가 더 풍부한 지식을 함양하도록 지원하는 것입니다.