5 5, 2017
5 5, 2017

다양한 예상 골 득점 모델에 대한 분석

예상 골 득점을 어떻게 계산할까요?

예상 골 득점 모델링에 대한 다른 접근법은 무엇일까요?

어떠한 예상 골 득점 모델이 가장 정확할까요?

다양한 예상 골 득점 모델에 대한 분석

예전에는 작은 규모의 스포츠 데이터 커뮤니티에 제한되어 있었던 예상 골 득점 측정법은 이제 볼 점유율, 유효 슈팅 및 파울 수와 같은 일반적인 축구 통계에도 사용되고 있습니다. 하지만 예상 골 득점에 대한 접근법은 다양합니다. 이 글에서는 사용할 서로 다른 모델을 비교하고 각 모델이 어떻게 다른 결과를 산출하는지에 대해 알아보겠습니다.

축구의 목표는 상대팀에게 골을 내주지 않으면서 득점하는 것입니다. 목표만 보면 단순해 보이지만 임의성과 운으로 인해 항상 "적합한" 결과를 얻을 수는 없습니다.

그렇기 때문에 스포츠 베팅에서 예상 골 득점과 같은 분석과 측정이 매우 유용합니다. 이를 통해 더 분석적인 기준으로 성적을 평가하고 "승리하지 못한 것은 운이 없었기 때문이다"같은 주장을 뒷받침할 수 있습니다.

슈팅은 골 결정력에 직접 연관되어 있으므로 슈팅 데이터는 예상 골 득점 모델에 아주 핵심적인 데이터입니다.

예상 골 득점(xG로 표현)은 축구팀이 사용하는 데이터 분석의 일종이며 베터들 사이에서 점차 많이 사용되고 있는 방법입니다. 예상 골 득점 통계는 온라인에서 널리 사용되지만 계산에 다른 모델이 사용되기 때문에 항상 같은 것은 아닙니다.

모델은 아주 단순한 것부터 복잡한 것까지 다양하며 다음에서 서로 다른 예상 골 득점 모델이 작용하는 방법을 설명합니다. 그렇다면 이렇게 다양한 모델들이 어떻게 작용하며 산출 결과는 얼마나 다를까요?

기본 슈팅 데이터 사용하기

Andrew Beasley는 기본 슈팅 데이터 모델을 사용하여 예상 골 득점을 계산하는 방법에 대해 설명한 적이 있습니다. 슈팅은 골 결정력에 영향을 미치기 때문에 슈팅 데이터는 예상 골 득점 모델에 아주 핵심적인 데이터입니다. 물론 축구 경기에서 골 득점으로 연결될 수 있는 이벤트는 무수히 많지만, 특정 결과를 예상할 때는 의심의 여지 없이 슈팅이 가장 중요합니다.

heat-map-inarticle.jpg

이 단순한 접근법은 선수가 득점할 수 있는 합리적인 상황에 대해 Opta에서 정의한 "절호의 기회"를 사용하고 페널티 박스 안팎의 슈팅을 모두 활용합니다.

지난 5회 동안의 Premier League 시즌 전환율은 0.387의 xG값(득점율 38.7%)을 나타내며 페널티 박스 안에서의 슈팅은 0.070, 밖에서의 슈팅은 0.036의 xG값을 보입니다.

슈팅 데이터의 상세 분석

주어진 축구장 크기에서 슈팅하는 각도와 이 각도가 득점에 미치는 영향 및 슈팅 위치에 대한 상세한 모델 분석 여부가 예상 골 득점 산출에 영향을 미치게 됩니다. 

grid-inarticle.jpg

Andrew Beasley의 기본 예상 골 득점 모델과 유사하지만 이 접근법은 xG값을 정하기 위해 슈팅 위치에 대해 더 깊이 있는 분석을 사용합니다. 가장 쉬운 방법은 골대까지 슈팅 범위를 격자로 나누고 각 위치에서 슈팅을 구상해보는 것입니다.

이 모델의 장점은 선수가 골대 정면에서 직접 슈팅(득점율 높음)하는지와 어려운 각도에서 슈팅(득점율 낮음)하는지를 비롯해 헤딩(득점율 낮음)인지 킥(득점율 높음)인지를 고려할 수 있다는 것입니다.

Paul Riley의 모델은 xG 모델을 구성할 때 슈팅 위치 데이터 분석을 더 깊이 있게 접근한 좋은 예입니다.

공격 전략 고려

물론 슈팅 위치가 전부는 아니며 선수가 사용한 신체 부위도 환산율 결정에 영향을 미칩니다. 슈팅하기 전 경기의 흐름 역시 확률 계산과 관련이 있습니다.

단순히 슈팅 위치에만 기반한 xG값을 정하기 전에 슈팅 기회가 만들어진 흐름(크로스패스, 스루패스, 카운터어택 등)과 슈팅이 이뤄진 흐름(성공적인 드리블에 따른 슈팅, 수비 성공 후 리바운드 등)에 대해 보다 상세히 들여다 볼 수 있는 모델이 있습니다.

pass-inarticle.jpg

이러한 모델을 구성하고 관리하기 위해서는 당연히 더 많은 데이터와 리소스가 필요합니다. 11tegen11의 xG 모델은 슈팅에 대한 해당 xG 값을 정할 때 공격 전략 범위를 더 넓게 고려하는 예상 골 득점 모델의 한 예입니다.

xG값에 수비가 미치는 영향

앞서 말한 세 가지 예상 골 득점 모델은 한 게임당 또는 시즌 전반에 걸쳐 한 팀이 얼마나 많은 골 득점을 할 수 있는지에 대해 상당히 적절한 예측값을 제시했습니다. 하지만 잠재적인 골 득점 기회에 영향을 미칠 수 있는 또 다른 변수가 있습니다.

단순히 슈팅 위치에만 기반한 xG값을 정하기 전에 슈팅 기회가 만들어진 흐름과 슈팅이 이뤄진 흐름에 대해 보다 상세히 들여다 볼 수 있는 모델이 있습니다.

축구는 공격이 전부가 아닙니다. 수비 배치와 상대팀의 골 득점 기회 저지 또한 중요합니다. 수비는 선수가 다른 방식으로 슈팅하게 하거나 득점이 더욱 어려운 방향으로 전환하게 만듭니다.

최종 움직임으로 이어질 수 있는 기회를 어떻게 만들지와 같은 전반적인 공격 전략 분석에 더해 상대팀 수비수의 근접도와 이것이 슈팅의 질에 미치는 영향을 고려하면 예상 골 득점 모델의 차원을 한 단계 높일 수 있습니다.

이는 슈팅 위치와 연관 지어 골키퍼와 수비수의 위치를 살펴봄으로써 가장 정확한 예상 골 득점 산출이 가능하다는 것을 의미합니다.

어떠한 예상 골 득점 모델이 가장 정확할까요?

이제 다양한 예상 골 득점 모델이 어떻게 작용하는지 알았으니 어떤 방법이 가장 정확한 결과를 만드는지 살펴봐야 할 차례입니다. 아래 표는 위에서 설명한 다양한 예상 골 득점 모델을 사용해 2016/17 Premier League 시즌에 각 팀의 실제 골 득점 차와 예상 골 득점 차를 비교한 것입니다.

실제 골 득점 차 vs. 예상 골 득점 차

실제 GD

모델 1 xGD

차이

모델 2 xGD

차이

모델 3 xGD

차이

Arsenal

33

+12.5

-20.5

+17

-16

+15.39

-17.61

Bournemouth

-12

-6.80

+5.20

-15

-3

-13.76

-1.76

Hull City

-43

-33.80

+9.20

-35

+8

-38.88

+4.12

Burnley

16

-19.20

-3.20

-26

-10

-21.06

-5.06

Chelsea

+52

+25.90

-26.10

+31

-21

+31.91

-20.09

Crystal Palace

-13

-1.50

+11.50

-5

+8

-6.05%

+6.95

Everton

+18

+5

-13

+1

-17

+1.82

-16.18

Sunderland

-40

-27.40

+12.60

-26

+14

-30.56

+9.44

Leicester City

-15

-7.60

+7.40

-7

+8

-6.65

+8.35

Liverpool

+36

+25.30

-10.7

+33

-3

+31.87

-4.13

Manchester City

+41

+41.80

+0.80

+44

+3

+51.13

+10.13

Manchester United

+25

+25

0

+24

-1

+29.48

+4.48

Middlesbrough

-26

-21

+5

-25

+1

-22.46

+3.54

Southampton

-7

+6.60

+13.60

+8

+15

+8.15

+15.15

Stoke City

-15

-0.60

+14.40

-2

+13

+0.45

+15.45

Swansea City

-25

-21.70

+3.30

-20

+5

-27.34

-2.34

Tottenham Hotspur

+60

+32.50

-27.50

+30

-30

+31.04

-28.96

Watford

-28

-12.20

+15.80

-13

+15

-16.14

+11.86

WBA

-8

-11.80

-3.80

-7

+1

-8.52

-0.52

West Ham United

-17

-11.10

+5.90

-7

+10

-9.83

+7.17

이러한 접근법의 정확도를 측정하는 가장 좋은 방법은 RMSD(평균 제곱근 편차) 혹은 RMSE(평균 제곱근 오차)를 이용하는 것입니다. 이는 각 팀의 실제 골 득점 차와 예상 골 득점 차 간의 차이 값을 곱해서 평균을 낸 뒤 각 평균값의 제곱근을 구해서 계산할 수 있습니다.

예상 골 득점 모델 정확도

모델 1 xGD

모델 2 xGD

모델 3 xGD

RMSD(평균 제곱근 편차)

12.92

12.55

12.01

보이는 바와 같이, 세 가지 접근법은 사용한 데이터 변수가 달랐음에도 2016/17 Premier Leauge 시즌에서 예상 골 득점 차 산출 값이 겨우 0.91 RMSD 차이로 매우 유사한 것을 알 수 있습니다.

하지만 한 시즌(380게임)은 어느 한 가지 접근법이 다른 접근법보다 정확하다고 얘기할 수 있을 만큼 충분한 샘플 사이즈가 아닙니다. 또한 한 게임당 RMSD값을 계산하는 것은 각 모델의 정확도에 대한 통찰을 얻고 한 게임에서의 골 득점에 얼마나 근접하여 예측했는지를 알 수 있는 척도가 됩니다.

예상 골 득점에 대해 더 알고 싶으신가요?

예상 골 득점에 대해 더 자세히 알고 이를 바탕으로 하여 베팅에 적용하고 싶다면 Premier League 베팅에 어떻게 적용할 것인가에 대한 Andrew Beasley의 설명을 참조하시기 바랍니다.

또한 Twitter에서 Paul Riley11tegen11를 팔로우하여 2017년 9월 10일에 열리는 피나클 예상 골 득점 논의에 참여하실 수 있습니다.

discussion-day-expected-goals-inarticle.jpg

베팅 정보 - 베팅 지원

피나클의 베팅 정보는 온라인의 모든 전문가 베팅 조언 중 가장 광범위한 콜렉션입니다. 모든 경험 수준에 맞추어서 피나클의 목표는 단 하나, 베터가 더 풍부한 지식을 함양하도록 지원하는 것입니다.