푸아송 모델의 한계 중 하나는, 무득점 무승부의 확률을 예측하기 어렵다는 것입니다. 이 기사는 푸아송 모델을 조정하여 무득점 무승부를 처리하는 방법을 설명합니다. 다음 내용을 읽으면서 자세한 내용을 알아보세요.
축구에서 득점을 예측하는 주요 모델은 푸아송 모델(또는 변형)입니다. 가장 직접적인 접근법은, 각 팀의 예상 골 매개변수를 설정하고 이에 맞게 점수를 예측하는 것입니다.
푸아송 모델을 요약하자면, 홈팀 매개변수는 리그 평균 홈 득점률에 홈팀에 기반한 공격 인수와 원정팀에 기반한 수비 인수를 곱한 값입니다. 공격 인수는 원정팀의 수비율에 맞게 홈 득점 어드밴티지를 조정한 것이며(수비가 강할수록 골 기회가 적어지는 것을 의미) 수비 인수는 홈팀 득점 능력을 조정한 것입니다. 원정팀의 예상 골 득점률도 비슷한 방식으로 산출하지만, 원정팀의 득점 인수와 홈팀의 수비 인수를 사용한다는 차이가 있습니다.
푸아송 모델의 한계
다른 모델과 마찬가지로 푸아송 모델로 축구 경기에서 점수를 예측하는 데에는 몇 가지 한계가 있습니다. 즉, 결과값은 사용한 매개변수의 변화에 민감합니다.
0-0으로 무승부가 될 수 있는 실질적인 확률은 골 득점률이 높은 팀일수록 높게 나타나는데 경기 시간이 꽤 많이 흘러도 득점이 없을 경우 경기 템포를 늦출 수 있기 때문입니다.
또한, 푸아송 모델은 일단 예상 골 매개변수가 설정되면 각 팀이 득점한 골 수는 독립적인 것으로 추정합니다. 이는 특정 수비/공격률을 사용해 어느 정도 조정이 가능하지만, 홈팀의 골 수가 5점인지 0점인지와 상관없이 원정팀이 5점을 기록할 기대 확률이 완전히 같을 수 있을까요?
가장 큰 한계는 각 팀이 득점한 골 수의 변동이 예상 골 수와 같다고 추정하는 푸아송 분포의 특성입니다. 과대산포(과소산포) 푸아송 모델과 이변량 푸아송 모델과 같이 이를 해결할 수 있는 현명한 방법이 있지만, 이 기사의 논제를 벗어나므로 살펴보지 않겠습니다.
이러한 한계로 나타나는 복합적 영향은 0-0 무승부(푸아송 모델의 결과보다 높거나 낮을 수 있음)를 평가하는 예측성이 부족하다는 것입니다. 푸아송 모델은 예상 골 매개변수가 높은 팀에 대해 0-0 무승부 확률을 축소해서 평가하는 경향이 있다고 생각합니다.
0-0으로 무승부가 될 수 있는 실질적인 확률은 골 득점률이 높은 팀일수록 높게 나타나는데 경기 시간이 꽤 많이 흘러도 득점이 없을 경우 경기 템포를 늦출 수 있기 때문입니다. 반대로 득점 골 수가 낮은 팀은 첫 골을 얻을 때까지 높은 템포를 유지할 수 있습니다. 표준 푸아송 모델은 이 사실을 잡아내기 어려우므로 0-0 무승부 확률을 과도하게 예측할 수 있습니다. 그렇지만 이 명제는 어떠한 실험에도 기반하지 않은 추측에 지나지 않으며 실제로 실험해보고 싶은 독자가 있다면 부디 제게 연락해주시기 바랍니다. 기쁜 마음으로 이야기를 나누고 싶습니다.
무승부 확률을 높이거나 낮추는 방법
0-0 무승부의 확률을 조정하는 접근 방법으로 이러한 무승부 확률을 높이거나 낮출 수 있으며 이에 따라 다른 예측도 조정할 수 있습니다. 이것은 다음의 간단한 예시를 통해 5단계 절차로 설명할 수 있습니다.
1단계: 팀별 예상 골 매개변수 계산
자동화된 절차가 없으면 아마 이 단계에 가장 많은 시간을 할애하실 것입니다. 푸아송 분포 기사에서 Benjamin Cronin의 훌륭한 설명을 확인할 수 있습니다. 간결성을 위해 홈팀과 원정팀의 최종적인 평균 골 매개변수가 각각 1.7 및 1.2라고 임의로 추정합니다.
2단계: 팀별로 득점한 골 수의 확률 계산
이 단계는 공식을 사용해 계산하며, 위의 링크를 통해 계산된 예시를 볼 수 있습니다. 이 경우 다음과 같은 공식에 따라 득점한 골 수의 확률 분포를 사용했습니다:
3단계: 최종 결과의 확률 분포 계산
이제 다른 최종 결과의 확률을 곱할 수 있습니다. 예를 들어, 최종 결과가 0-0이면 18.3% x 30.1% = 5.5%의 가능성이 있는 것입니다. 결과는 다음과 같이 나타납니다. 결과는 다른 점수의 확률로 인해(예: 5-1) 모두 합해도 100%가 되지는 않습니다. 다른 점수의 확률인 3.7%를 더할 수 있습니다.
최종 결과의 확률 분포 계산
4-a단계: 0-0 무승부에 대한 증가/감소 매개변수 계산
이 단계에서 주관성이 개입합니다. 예를 들어 과거 통계에서 0-0 무승부 확률이 10%임을 나타낸다고 가정해봅시다. 따라서 5.5%를 10%로 늘려야 합니다.
증가 파라미터는 다음과 같이 계산할 수 있습니다.
(0-0의 추정 확률)/(예측 확률)=(추정 확률)/(확률(0,0))
이 값을 α로 나타내면 다음과 같은 결과를 얻을 수 있습니다.
α=10/5.5=1.82.
이 값은 무득점 무승부 확률이 82%만큼 증가했다는 것을 의미합니다. 무승부 확률이 5.5%에서 10%로 증가하면서 총 결과값이 100%가 되도록 하려면 다른 확률이 동일한 누적 확률만큼 감소해야 합니다.
4-b단계: 다른 점수에 대한 증가/감소 매개변수 계산
이 인수를 β로 가정하면 다음 공식을 사용할 수 있습니다.
β=(1-α[확률(0,0)])/(1-[확률(0,0)])=(1-추정 확률)/(1-예측 확률)
이 경우 β=(1-0.1)/(1-0.055)=0.95를 얻을 수 있습니다.
5단계: 증가된 최종 결과 표 다시 채우기
이제 최종적으로 0-0 무승부 확률에 α를 곱하고 나머지에 β를 곱해서 다른 득점 확률을 다시 계산할 수 있습니다. 다음과 같은 결과를 얻을 수 있으며 득점 확률은 3.5%가 됩니다.
증가된 최종 결과 다시 채우기
푸아송 모델 조정을 통해 배울 수 있었던 것은 무엇일까요?
기사 전체에 걸쳐 무득점 무승부의 확률을 바꾸는 전통적 푸아송 모델을 어떻게 조정하는지에 대해 알아보았습니다. 이 모델은 모든 결과의 확률 값이 조정 후 합산 100%를 만족한다는 전제하에 어떠한 최종 결과 조정에도 활용할 수 있습니다.
이 모델이 결과 예측 확률 변경에 사용할 수 있는 유일한 접근 방법은 아닙니다. 예를 들어, Alun Owen 박사는 지난 6월에 있었던 MathSport 학회에서 절단된 푸아송 모델을 포함한 더 나은 접근 방법을 설명했습니다.
이러한 조정이 앞서 언급한 푸아송 모델의 한계를 최소화해주지는 않습니다. 사실 이렇게 하면 무득점 무승부의 추정 확률과 다른 모든 확률이 동일한 β 비율로 조정된다는 다른 추정이 추가됩니다. 그렇기는 하지만 무득점 무승부가 과대/과소평가되는 경향이 있는 전통적 모델에 비해서는 상당히 개선된 것입니다.