1 24, 2023
1 24, 2023

충격과 이변: 2022 월드축구컵은 얼마나 놀라웠을까요?

2022 월드축구컵은 얼마나 놀라웠을까요?

몬테카를로 확률

2022 월드축구컵의 언더독들

충격과 이변: 1부

충격과 이변: 2022 월드축구컵은 얼마나 놀라웠을까요?

2022 월드축구컵은 얼마나 충격적이었을까요? 독일을 이긴 일본이 다였을까요? Joseph Buchdahl이 데이터를 상세히 분석하여 중요한 이변들이 우리가 생각하는 만큼 놀라운 일이었는지 알아봤습니다.

스포츠 메타데이터 기업인 Gracenote에 따르면 2022 카타르 월드축구컵은 64년만에 가장 많은 15 경기에서 이변이 나오면서 언더독들을 위한 대회가 되었습니다.

카타르는 64년만에 가장 충격적이었던 월드축구컵이었습니다

그렇다면 그 수치는 얼마나 놀라웠으며, 우선 이변인지 여부를 결정하는 기준은 무엇일까요?

우리는 스페인과 독일을 상대로 한 일본의 승리, 아르헨티나를 상대로 한 사우디아라비아의 승리를 이변으로 생각합니다. 이 이변은 스페인과 독일, 아르헨티나가 이긴다는 우리의 생각이 타당하다는 것을 전제로 합니다.

직관적으로는 그러한 결과가 나오는 것이 당연하다고 생각할 수 있지만, 진정한 결과 확률을 완벽하게 알 수 없다면 언제나 오류의 가능성에 경각심을 가져야 할 것입니다

놀라운 축구 결과가 나왔다면, 정확한 예측 모델 등에서 인정한 언더독에게 운이 따랐기 때문이었을까요, 아니면 언더독으로 여겨진 팀이 사실은 언더독이 아니었고 예측 모델이 잘못되었기 때문이었을까요?

철학적인 관점에서 이것은 흥미로운 동시에 상당히 풀기 어려운 퍼즐입니다. 여기서 우리는 두 가지 유형의 불확실성을 다룰 것입니다.

예측 모델 타당성의 불확실성이나 오류는 인식론적 불확실성이라고 하며, 이론 상 더 나은 모델링을 통해 줄일 수 있습니다.

또 다른 불확실성으로는 본질적 불확실성이 있으며, 흔히 우연, 행운, 무작위성이라고 합니다.

이 불확실성은 줄일 수 없습니다. 인식론적 불확실성과 무작위 불확실성은 분리하기가 어려울 수 있습니다. Pinnacle을 위해 작성한 두 건의 기사를 통해 불확실성에 관하여 약간의 도움을 드리고자 합니다. 첫 기사에서는 월드축구컵 전체에서 놀라움의 요소를 살펴보고자 합니다.

두 번째 기사에서는 월드축구컵을 이용하여 효율성을 테스트하고, 그 결과가 북메이커 베팅 배당율의 정확성(또는 효율성)에 대해 알려주는 내용, 그리고 배당률을 만들어내는 예측 모델의 타당성에 대해 이야기할 것입니다.

64 경기 멀티플 확률

각 월드축구컵 경기에서 90분 경기를 통해 나올 수 있는 세 가지 결과의 확률을 예측해보면, 모든 결과 조합의 64 경기 멀티플 확률을 구성할 수 있습니다. 그렇다면 우리는 어떤 결과 확률을 이용해야 할까요?

베터를 지망하는 많은 사람들이 각기 다른 본인의 방식으로 계산을 하겠지만, 저는 시간을 아끼고 이용 가능한 최선의 확률 중 하나로 인정할 수 있는 Pinnacle의 경기 마감 베팅 배당률에 내재된 확률을 이용해보겠습니다.

저는 Pinnacle의 마감 배당률이 왜 진정한 확률 결과를 예측하기에 가장 좋은 정보인지 여러 번 길게 설명했습니다.

Pinnacle은 물론 그러한 배당률에 마진을 더하기 때문에 일단은 그 마진을 제거해야 합니다. 저는 마진을 제거하는 저만의 계산기를 갖고 있습니다.

이어서 이러한 멀티플 확률을 이용하여 2022 월드축구컵 경기들의 결과는 얼마나 놀라웠는가 라는 질문에 대한 답을 구해볼 수 있습니다.

내러티브의 오류

잠시 월드축구컵 64 경기 중에서 이변이 한 번도 나오지 않을 확률은 거의 없다는 점을 살펴보는 것이 좋을 것입니다.

승리 후보들이 모두 경기에서 이길 확률은 11%입니다.

Pinnacle의 마감 배당률을 이용하여 저는 90분 경기를 마친 후 그러한 결과가 나올 확률을 6.5 x 10-17, 즉 100경 분의 1보다 약간 높은 것으로 계산했습니다.

그런 일이 일어났다면 인류 역사 상 가장 놀라운 대회 중 하나가 되었을 것입니다.

그런 일이 실제로 일어났다면 통계학자들을 제외한 많은 사람들이 정말 지루한 월드축구컵이었다고 말하는 것 외에 과연 많은 관심을 주었을지 궁금합니다.

개수가 3의 64승, 즉 정확히 말하자면 3,433,683,820,292,512,484,657,849,089,281개인 64 경기의 무수히 많은 멀티플 중 하나 걸러 하나씩에 해당하는 낮은 확률을 갖습니다.

각각의 멀티플은 이변을 포함하며 (승리 후보가 이기지 못하는 경우를 이변으로 정의하는 경우), 멀티플 확률이 작을수록 이변의 수는 커집니다.

하지만 이변이 발생하지 않는 경우는 승리 후보가 이기는 경우가 발생하는 단 한 가지입니다. 이와 반대로 이변이 발생하는 방법은 많이 있습니다. 64 경기 멀티플 확률은 개별적으로 보면 작을 수 있지만 함께 묶어서 보면 이변이 발생하지 않을 확률보다 더 높습니다.

두 가지 결과가 존재하는 10 경기에서 승리 후보의 승리 확률은 80%이며 언더독의 승리 확률은 20%인 이항 예시를 생각해보겠습니다.

승리 후보들이 모두 이길 확률은 11%이며 세 언더독이 이길 확률은 20%, 네 언더독이 이길 확률은 9%입니다.

왜 그렇게 높은 것일까요? 개별적으로 보면 확률은 단 0.17%와 0.04%이지만(특정한 세 언더독 팀 또는 네 언더독 팀이 이길 확률) 전체 경기 중에서 세 언더독 팀이 이기는 경우는 120 가지이며 네 언더독 팀이 이기는 경우는 210가지가 있습니다.

이런 식으로 이변을 예상할 수 있습니다. 하지만 우리의 뇌는 이변을 실제보다 더 예상치 못한 것으로 여기는 세상을 이해하기 위해, 데이터로부터 간단하고 때로는 결함이 있는 이야기를 만들어내는 경우가 너무 많습니다.

일본이 스페인과 독일을 이기지 못했더라면 우리는 그 결과에 대해 이야기하지 않았을 것입니다. 하지만 통계는 우리에게 이러한 놀라운 결과들이 통계적 확실성을 갖고 있다고 말합니다. 이것이 내러티브의 오류의 예입니다.

몬테카를로 확률 분포

6.5 x 10-17의 확률로 64 경기 멀티플이 나올 수 있는 방법은 단 한 가지입니다. 언더독들이 모두 승리를 거두는, 가능성이 가장 낮은 멀티플의 확률은 1.5 x 10-51이며, 이 결과가 나오는 방법 역시 단 한 가지입니다. 하지만 10-25 또는 10-30과 같은 멀티플 확률이 발생하는 방법은 몇 가지가 있을까요?

이러한 계산을 알고리즘으로 처리하는 것은 너무 복잡한 일입니다. 계산을 쉽게 하기 위해 몬테카를로 시뮬레이션을 구축하는 것이 좋을 것입니다.

정의된 Pinnacle 함축 배당률에 따라 경기 결과들을 무작위화하면 64 경기 멀티플 확률을 무작위로 생성할 수 있습니다.

이 과정을 여러 차례 반복하고 정의된 확률들이 각각 몇 번이나 발생하는지 계산하면 발생 가능한 확률 분포를 정의할 수 있습니다. 즉, 우리는 64 번의 월드축구컵 경기에서 나올 수 있는 결과들의 범위와 가능성을 정의할 수 있습니다.

아주 작은 확률 값을 처리하는 것은 직관적으로 생각해도 다소 어려운 일입니다. 하지만 약간의 변형을 적용하면 더 인지하기 쉽게 만들 수 있습니다. 즉, 로그를 계산하면 됩니다.

예를 들어 0.001의 로그(밑 10)은 -3이 되며 0.000001은 -6, 0.000000000001은 -12가 됩니다. 저는 저의 계산 목적을 위해 (밑 e) 자연 로그 (ln)을 이용하고 음수 기호를 뺄 것입니다.

저의 몬테카를로 시뮬레이션은 무작위화한 64 경기 멀티플 확률의 자연 로그 100,000값에 대해(음수 기호 제거) 100,000회 실행을 포함합니다.

이를 소집단화한 후 다음의 빈도(또는 확률) 분포표에 표시하였습니다.

Shock-WC.png
이 도표에서 x축 전체 범위는 37.3(64개 승리 후보 팀이 모두 승리)에서 117.1(언더독이 모두 승리)이나 우리는 이 두 사건의 가능성이 불가능할 정도로 낮다는 것을 알고 있습니다.

사실, 확률의 범위를 파악하기 위해서는 가장 가능성이 높은 결과들만 보여주면 됩니다. 도표를 보면 64 경기 멀티플의 x축 값이 대략 45에서 75 사이에 나올 가능성이 매우 높다는 것을 알 수 있습니다.

이는 대략 각각 3 x 10-20과 3 x 10-33 멀티플 확률에 해당합니다.

x축을 따라 오른쪽으로 이동하면 멀티플 확률은 감소합니다. 평균적으로, 또는 관찰 가능성이 높은 멀티플 결과는 x축 값이 약 60이며 7.5 x 10-27의 멀티플 확률에 해당합니다.

또한 이 도표에서 검정색 수직선으로 나타낸 실제 월드컵 멀티플 결과를 확인할 수 있습니다. 이 결과의 x축 값은 63.5 (멀티플 확률 2.7 x 10-28)입니다.

이것은 가장 발생 가능성이 높은 멀티플 결과보다 약 28배 작습니다.

이 값은 큰 것으로 느껴지지만 도표를 보면 그렇지 않습니다. 확률 분포의 중앙(평균)에서 그리 멀지 않다는 것을 볼 수 있습니다. 실제로 발생 가능한 월드축구컵 멀티플 확률 중 약 20%가 실제 나타난 결과보다 작았습니다.

통계적으로 보면 이 결과를 놀랍다고 하지 않을 것입니다. 놀라운 결과라고 말할 수 있으려면 수직선을 x 축 상에서 70 이상 옮겨 1% 미만의 멀티플 확률이 나와야 할 것입니다. 이는 약 4 x 10-31, 실제 결과보다 거의 700배 낮은 멀티플 확률에 해당합니다.

이러한 확률을 얻으려면 카타르가 네덜란드를 이기고 폴란드가 프랑스를 이기며 한국이 브라질을 이기는 등의 결과가 나왔어야 했을 것입니다.

이번 월드축구컵은 놀라운 대회였을까요?

본문에서 제가 제시한 데이터를 통해 이제 처음 질문에 답변할 수 있게 되었습니다.

아니요, 그리 놀랍지 않았습니다. 개별 경기를 보면 놀라운 이변이 발생했지만, 우리는 많은 경기를 치르는 토너먼트에서 그러한 결과를 예상할 수 있다는 점을 알게 되었습니다. 사실, 아무 이변도 발생하지 않는 것이 훨씬 놀라운 일이 될 것입니다.

하지만 철학적인 관점에서 놀랍다는 것이 실제로 어떤 의미일까요? 놀라움이라는 것은 경기에 대한 처음 기대에 크게 의존합니다.

극단적인 예시를 제시해본다면, 저의 예측 모델이 웨일스가 잉글랜드를 상대로 승리를 거둘 것이 유력하며 가나가 포르투갈을, 호주가 프랑스를, 코스타리카가 독일을 이길 가능성이 높은 팀 등으로 예상했다고 가정해보겠습니다.

그랬다면 저는 경기 결과를 보고 매우 놀랐을 것입니다. 놀란 이유는 과연 저의 모델이 결정한 언더독에게 운이 따랐기 때문일까요, 아니면 저의 예측 모델이 잘못되었기 때문일까요?

이와 같은 경우에는 답이 간단하겠지만, 이와 다른 일반적인 경우에는 두 팀의 우위를 구분하는 것이 훨씬 더 미묘합니다.

Pinnacle의 경기 확률 예측은 경기가 어떻게 펼쳐질지 완벽하게 포착하지 않았습니다. 그 이유는 운이 좋지 않기 때문이었을까요, 아니면 모델의 오류 때문이었을까요?

이 문제는 훨씬 답하기 어렵습니다. 하지만 Pinnacle의 예측과 실제 경기 결과 사이에서 통계적으로 유의미한 차이가 나타나지 않았으므로 Pinnacle의 모델이 그다지 나쁘지 않다고 말할 수는 있을 것입니다.

다시 말해서 (Pinnacle의 관점에서 봤을 때) 월드축구컵은 통계적으로 그리 특별히 놀랍지 않은 대회였습니다. 발생 가능성이 높았던 결과(실제 결과보다 이변이 두 세 경기 적은 것으로 예측된 결과)보다는 확률이 낮은 결과가 나왔지만 그 차이가 엄청나게 크지는 않았습니다.

통계적으로 유의미한 차이가 있었다면 Pinnacle의 시각에 쉽게 이의를 제기할 수 있었을 것입니다.

따라서 우리는 한 가지 규칙을 만들 수 있습니다: 기대와 현실 사이의 차이가 클수록 우리의 예측 모델이 잘못되었을 통계적 가능성이 높아집니다. Pinnacle의 월드축구컵 경기 예측 모델은 다른 북메이커의 모델과 비교했을 때 어땠을까요? 이것은 이 시리즈의 2부에서 다룰 주제입니다.

Pinnacle에 가입하여 광범위한 시장의 축구 배당률을 이용해보세요. 베팅 정보에서 Joseph Buchdahl이 깊은 통찰력을 갖고 작성한 다른 글들을 확인해보세요.

베팅 정보 - 베팅 지원

피나클의 베팅 정보는 온라인의 모든 전문가 베팅 조언 중 가장 광범위한 콜렉션입니다. 모든 경험 수준에 맞추어서 피나클의 목표는 단 하나, 베터가 더 풍부한 지식을 함양하도록 지원하는 것입니다.