在英超過去五個賽季,每場比賽平均只踢進 2.73 球,在足球比賽中進球相對來說並不常見。如同熱門足球資料集《The Numbers Game》所述,將近 50% 的比賽結果和運氣有關,例如球的彈跳或裁判的判決。
因此在預測中使用更多資料樣本非常重要。所以與其在預測模型中使用 2015/16 年英超的每場比賽平均進球數 2.73 球,我們還可以使用 8.49 的「射正次數」,或是 25.7 的總射門次數。
問題在於雖然所有進球的價值都相等,但每次射門成功進球的機率大不相同,這裡就需要用到進球期望值(或射門的「xG」)。平均而言,在英超過去五個賽季中,9.7% 的射門能成功進球,但如果把射門分門別類,就會發現進球機率有極大差異。
我們可以透過檢視歷史資料來計算每次射門的平均進球機率,也可以自行決定考量的因素多寡。部分深入的模型會考量射門是踢進或頭錘進球、什麼情況會導致射門等等。這需要進階的資料收集和統計分析 技巧,但使用更為簡單的進球期望值系統仍然可能提供深入的資訊。現在我會解釋我使用的方法。
計算不同進球類型的期望值
讓我們從罰球開始。在英超 2011/12 年到 2015/16 年賽季中共有 443 次罰球,其中有 347 次進球 - 這表示 78.3% 的罰球可以 成功進球。因此我們設定罰球的進球期望值為 0.783。
在 Opta 的分類中,極佳的進球機會稱為「大好機會」,定義為「合理預期球員會進球的情況(通常是一對一的情況或極近的距離)」。
在英超過去五個賽季中,6,213 次「大好機會」共有 2,579 次進球。不過我們要記住,此數據包含罰球,不含罰球的「大好機會」進球率則是 38.7%,即為這些射門的 xG 數值為 0.387。
考量此部分之後,剩下的就是其他禁區內的射門。在過去五年當中,禁區內共有 22,822 次「非大好機會」射門,其中有 1,587 次進球 - 所以平均進球期望值為 0.070。
最後,還有禁區外射門。從 2011 年 8 月到 2016 年 5 月,英超有 22,318 次禁區外射門,其中有 809 次進球,所以平均進球率為 3.6%。因此禁區外射門的進球期望值為 0.036。其中還會有一些差異,因為直接自由球的進球率約為 5 到 6%,但此簡單系統使用 3.6% 的數據就可以了。
如何計算各隊的進球期望值
各種足球網站和應用程式都會提供射門資料,只要利用這些知識,您就可以快速建立各隊在比賽中的 xG 記錄。根據本賽季的比賽(截至 2017 年 3 月 12 日),就能看出上述資料比簡單的射門資料更能為您帶來優勢。在 211 場有隊伍「獲勝」(不包括烏龍球)的英超比賽中,其中有 151 (71.6%) 場是射門次數較高的隊伍獲勝,而其中有 170 (80.6%) 場是 xG 數值較高的隊伍獲勝。
我使用 2016/17 年賽季的 xG 資料和卜氏分布,預測英超第 29 週的比賽結果和賠率如下。
根據 xG 數值預測分數
我們可以從「預測結果」欄看到一個正確分數和其他四個準確的結果選項(主場獲勝、和局或客場獲勝)。利用我的系統計算的賠率,可以看到十場比賽中有六場是熱門隊伍「贏得」投注,但您顯然必須比較您的賠率和 Pinnacle(畢諾克)提供的賠率,再決定如何投注。要瞭解如何計算,請從我們的熱門文章投注賠率代表的意義開始。
xG 預測模型的限制
要謹記任何模型都有其限制。不論您的系統有多棒,它不會知道明星前鋒受傷、俱樂部更換經理之後似乎重獲新生,或是隊伍可能在征戰歐洲錦標賽後疲憊不已。
這種系統也無法預測分數特別高的比賽。這並不讓人意外,因為系統是根據平均值,而約一半的比賽進球數少於 2.5 球。
雖然所有射門平均來說都有 0.097 的進球期望值,使用此簡單系統可以發現,曼徹斯特城目前的射門平均進球期望值是 0.113,而赫爾城只有 0.083。
使用進球期望值的統計資料,能幫助您準確地量化隊伍的防守和進攻實力。只要將以上資料配合卜氏分布,就能嘗試準確預測足球比賽的分數。