close
九月 5, 2017
九月 5, 2017

分析各種進球期望值模型

如何計算進球期望值?

有哪些不同方法可以建立進球期望值模型?

哪種進球期望值模型最準確?

分析各種進球期望值模型

計算進球期望值原本只是運動資料分析當中的一小部分,現在它卻比其他常見的足球數據(例如控球、射正和犯規次數)更受重視。然而,計算進球期望值的方法卻有很多種。本文探討用於建立進球期望值模型的各種方法,以及它們產生的結果有何差異。

足球比賽的目標是突破對手防守進球,以及避免對手進球。聽起來很簡單,不過因為隨機性和運氣等因素影響,隊伍不一定能獲得「應有」的結果。

因此資料分析和進球期望值等數據在運彩中十分有用-我們可以使用更精密的觀點分析隊伍表現,並且為各種看法(例如「他們沒贏球只是運氣不佳」)提供實質基礎。

對於進球而言,射門是決定性的動作,因此射門資料對於任何進球期望值模型來說都很重要。

進球期望值(通常簡稱為 xG),是足球隊使用的一種資料分析方法,它也越來越受投注者歡迎。許多網站都提供進球期望值數據,不過因為使用的計算模型不同,所以數據也不盡相同。

模型可以很簡單,也可以很複雜,以下說明各種進球期望值模型的原理有何差異。那麼,各種模型背後的原理為何,它們產生的結果有何差異?

使用基本射門資料

Andrew Beasley 之前解釋過如何使用基本射門資料模型計算進球期望值。對於進球而言,射門是決定性的動作,因此射門資料對於任何進球期望值模型都很重要-足球比賽中有許多有利進球的事件,不過如果專門想預測「進球」這項結果,射門無疑是最重要的資料。

heat-map-inarticle.jpg

這個簡單的方法利用 Opta 所定義的「進球良機」:合理預期球員可進球的情況,以及禁區內和禁區外射門資料。

根據過去五個英超賽季的進球率,「進球良機」的 xG 數值為 0.387(38.7% 的進球率),禁區內射門的數值為 0.070,禁區外射門的數值為 0.036。

詳細分析射門資料

因為足球場十分廣闊,球員可以從各種不同角度射門,這也影響了進球的可能性,因此模型是否詳細分析射門位置,會影響它計算出的進球期望值資料。 

grid-inarticle.jpg

雖然和 Andrew Beasley 的基本進球期望值模型類似,這種方法會更深入分析射門位置,再計算 xG 數值。最簡單的方式就是將球門前的射門範圍劃分為許多區塊,再針對各區塊內的射門進行計算。

使用這種模型的好處,就是它能分辨球員從球門正面直接射門(非常可能進球)和球員從大角度射門(不太可能進球)的差異,並且也考量球員是頭錘(較難進球)或腳踢(較易進球)射門。

Paul Riley 的模型就是採用較進階方式分析射門位置資料以建立 xG 模型的良好範例。

考量進攻過程

當然,射門是否能成功進球並非單純取決於射門位置和使用的身體部位。射門前的比賽過程,對於進球的可能性也有影響。

部分模型並非單純利用射門位置來計算 xG 數值,還會考量射門機會產生的過程(橫傳、穿越傳球、反攻等),並且更詳細分析射門的方式(成功盤球後射門、救球後的反彈球等)。

pass-inarticle.jpg

當然,需要有更多資料和資源才能建立並維持這種模型的運作-11tegen11 的 xG 模型就是一個考量更多進攻過程以計算射門 xG 數值的進球期望值模型範例。

防守對於 xG 的影響

上述三種建立進球期望值模型的方法,都適用於估計隊伍單場比賽的進球期望值,或是整個賽季的進球期望值。然而,還有其他因素會影響潛在進球機會。

部分模型並非單純利用射門位置來計算 xG 數值,還會考量射門機會產生的過程,並且更詳細分析射門的方式。

進攻並非足球比賽的唯一因素。防守位置以及降低對手進球機率也一樣重要-防守球員可以迫使對方球員以不同方式射門,或是在緊要關頭進行調整使對方難以進球。

除了分析整個進攻過程(從如何創造射門機會到最後的射門位置),考量對方防守球員的遠近,以及這對於射門進球可能性的影響,可以建立出更複雜的進球期望值模型。

這表示,考量射門位置以及守門員和防守球員的相對位置,可以產生最準確的進球期望值結果。

哪種進球期望值模型最準確?

現在我們已瞭解各種進球期望值模型的原理,可以開始分析哪種進球期望值模型能產生最準確的結果。下表比較 2016/17 年英超賽季各隊的實際進球差距,以及上述各種進球期望值模型計算的進球期望值差距。

比較實際進球差距和進球期望值差距

隊伍

實際進球差距

模型 1 進球期望值差距

差異

模型 2 進球期望值差距

差異

模型 3 進球期望值差距

差異

兵工廠

+33

+12.5

-20.5

+17

-16

+15.39

-17.61

伯恩茅斯

-12

-6.80

+5.20

-15

-3

-13.76

-1.76

赫爾城

-43

-33.80

+9.20

-35

+8

-38.88

+4.12

班來

-16

-19.20

-3.20

-26

-10

-21.06

-5.06

切爾西

+52

+25.90

-26.10

+31

-21

+31.91

-20.09

水晶宮

-13

-1.50

+11.50

-5

+8

-6.05

+6.95

艾佛頓

+18

+5

-13

+1

-17

+1.82

-16.18

桑德蘭

-40

-27.40

+12.60

-26

+14

-30.56

+9.44

萊斯特城

-15

-7.60

+7.40

-7

+8

-6.65

+8.35

利物浦

+36

+25.30

-10.7

+33

-3

+31.87

-4.13

曼城

+41

+41.80

+0.80

+44

+3

+51.13

+10.13

曼聯

+25

+25

0

+24

-1

+29.48

+4.48

米德斯堡

-26

-21

+5

-25

+1

-22.46

+3.54

南安普頓

-7

+6.60

+13.60

+8

+15

+8.15

+15.15

斯托克城

-15

-0.60

+14.40

-2

+13

+0.45

+15.45

斯旺西

-25

-21.70

+3.30

-20

+5

-27.34

-2.34

熱刺

+60

+32.50

-27.50

+30

-30

+31.04

-28.96

沃特福德

-28

-12.20

+15.80

-13

+15

-16.14

+11.86

西布朗維奇

-8

-11.80

-3.80

-7

+1

-8.52

-0.52

西漢姆

-17

-11.10

+5.90

-7

+10

-9.83

+7.17

評估各種方法準確度的最佳方式就是計算方均根偏移 (RMSD),有時也稱為方均根差 (RMSE)。計算方式如下:計算各隊實際進球數差距和進球期望值差距的差異的平方,計算平均值之後再將平均值開根號。

進球期望值模型準確度

模型 1 進球期望值差距

模型 2 進球期望值差距

模型 3 進球期望值差距

RMSD

12.92

12.55

12.01

結果顯示,對於 2016/17 年英超賽季的資料而言,這三種不同方法產生的進球期望值差距都非常相似-即使它們採用的資料複雜度不同,三種方法之間的差異僅有 0.91 RMSD。

然而一個賽季(380 場比賽)的樣本數並不足以確切判斷哪一種方法最優秀。此外,計算每一場比賽的 RMSD 更有可能看出各種模型的準確度,以及它們預測單場比賽進球數的能力有何差異。

想深入瞭解進球期望值?

如果您想深入瞭解進球期望值,並在投注中學以致用,Andrew Beasley 已撰寫過如何將此數據應用於英超投注的文章。

您也可以在 Twitter 上追蹤 Paul Riley11tegen11,並且參加 Pinnacle(畢諾克)2017 年 10 月 9 日的進球期望值討論日。

discussion-day-expected-goals-inarticle.jpg

投注資源 - 增進您的投注能力

Pinnacle(畢諾克)的投注資源是線上最全面的專業投注建議資料庫之一。我們的目標就是增進投注者的博彩知識-不論投注者投注經驗多寡。