九月 19, 2017
九月 19, 2017

運動投注系統的陷阱:關聯性和因果性

運動投注系統:何謂迴歸分析?

利用系統進行投注預測

迴歸分析的陷阱

運動投注系統的陷阱:關聯性和因果性

如果想確保投注長期獲利,投注系統相當重要。然而,投注者常把資金管理和投注系統混為一談,分析結果時也搞不清楚關聯性和因果性。何謂投注系統?關聯性和因果性有何差異?繼續閱讀以深入瞭解。

何謂投注系統?

本金管理法 或資金管理策略(分配投注本金金額的方法)不同,運動投注系統是以歷史資料定量分析為基礎的結構性預測法,設計用於克服博彩業者的利潤並尋找正期望值

投注者常把資金管理和投注系統混為一談-在 Google 搜尋「投注系統 (betting system)」時,出現的大多是 MartingaleLabouchereFibonacci 等策略,不過它們其實是截然不同的東西。

資金管理單純改變投注相關風險的性質;然而長期來說,它卻無法讓失敗的預測方法轉虧為盈。相反地,投注系統試圖尋找運動比賽中事件發生的「真實」機率。

運動投注系統:迴歸分析

設計運動投注系統時,最廣為使用的方法就是統計迴歸分析。對於不熟悉統計術語的人來說,聽起來可能很難懂,不過它其實只是一種估計變數關係的方法。

雖然迴歸分析對於設計投注系統而言是一種很有用的工具,它的潛在弱點是無法分辨關聯性和因果性。

其中最簡單的方法是「簡單線性迴歸」,只考量兩個變數,例如隊伍的進球數(預測因子或自變數)和勝率(反應變數或應變數)。 

在我的第一本著作《Fixed Odds Sports Betting: Statistical Forecasting & Risk Management》中,根據兩支隊伍前 6 場比賽的相對進球優勢,探討簡單迴歸模型。

如果使用大量比賽樣本(此處使用 1993 年到 2001 年的 8 個賽季),就可以根據計算的比賽表現(主場隊伍 6 場比賽的進球數差異,減去客場隊伍 6 場比賽的進球數差異)和各場比賽結果勝率,繪製它們的相關性圖表。比賽表現(自變數)和主場勝率(應變數)的分布圖如下。

correlation-and-causation-inarticle.jpg

雖然圖中各個資料點有點分散,不過這兩個變數有明顯的線性相關趨勢:主場隊伍如果比客場隊伍有更好的前 6 場比賽進球數差異,主場隊伍贏得比賽的機率就越高。

圖中所畫的迴歸線基本上表示相對進球優勢和主場勝率的理想關係(去除雜訊或隨機的運氣好壞)。

我們可以用一個公式來描述以上迴歸線;簡單線性迴歸模型的公式為 y = mx +c,y 為應變數(勝率),x 為自變數(比賽表現),m 是趨勢線的斜率或傾斜度(代表關係強度的數值),c 是常數或趨勢線和 Y 軸的交點(即為 x = 0)。在此範例中,公式為:

主場勝率 = (1.56 x 比賽表現) + 46.5

當比賽表現為零時(也就是主場和客場隊伍的進球數差異不相上下),勝率為 46.5%。這似乎很符合常理,足球比賽的主場勝率大約就是 46%。如果主場隊伍在前六場比賽的淨進球差異比客場隊伍多 10 球,迴歸模型顯示這種隊伍的勝率一般來說為 62%。如果優勢為 20 球,勝率上升到 78%。 

我們的迴歸分析也能根據投注系統模型,告訴我們勝率的變異程度。此例為 86%。和資料十分相符的趨勢線顯示出這一點。它顯示這兩個變數有強烈的關聯性。

利用系統進行投注預測

如果要把迴歸模型轉變為功能完整的投注系統,就需要預測未來比賽,並且利用它來找出擁有正期望值的投注。

資金管理單純改變投注相關風險的性質;然而長期來說,它卻無法讓失敗的預測方法轉虧為盈。

如同大多數建立模型的方法,標準假設是未來取決於歷史資料。如果過去比賽的比賽表現為 +10 球可以導致 62% 的勝率,那麼假設就是:主場隊伍的進球優勢比對手多 10 球,贏得比賽的機率為 62%。 

接著我們就可以將這些機率轉變為「真實」賠率,然後尋找正期望值(博彩業者提供更高的賠率)。利用此模型分析 2001/02 年英格蘭足球聯賽賽季之後,在 526 筆可獲得最佳主場獲勝投注賠率的投注中,我能夠達成 +2.1% 的獲利,相對來說,盲目投注該賽季所有主場隊伍皆獲勝會損失 -3.7%。

關聯性和因果性 

僅僅是一個賽季的 500 筆投注,不代表保證能持續連年獲利。雖然這個數目看似足以確保投注系統的可靠性,不過經常閱讀投注資源文章的讀者,就知道並非如此。

Pinnacle(畢諾克)關於小數法則的文章,告訴我們即使是 1,000 筆投注樣本也可能產生虛假的獲利模式,事實上根本沒有因果關係基礎,單純只是機率使然。很可惜,利用此投注系統投注下五個賽季,都以損失收場。

雖然這個簡單的進球優勢迴歸模型可以找出較可能獲勝的主場隊伍,它卻無法保證,所找出隊伍的獲勝機率能勝過博彩業者賠率的隱含機率。

遺憾的是,許多運彩投注者研究投注記錄時,常誤解精確度、準確度和效度,並且在研究過程中將關聯性和因果性混為一談。

我的模型可能是很好的預測工具,不過它似乎和博彩業者用於設定賠率的預測模型不相上下,和其他投注者用於協助設定、調整賠率的模型相比,也好不了多少。

如果我的模型只能複製博彩業者模型的行為,就無法持續獲利,獲利也單純是變幻莫測隨機性的反映。模型似乎沒有任何有效的關聯性基礎。和其他功能相同的模型相比,我的模型準確度不相上下,因此模型預測無法「導致」獲利。

精確度和準確度

當然,在用於尋找正期望值的模型中,雙變數線性迴歸模型絕非最複雜的投注系統。納入更多自變數或預測因子的多元迴歸,是能提高預測精確度的方法。然而,進行分析時應小心,不要犧牲準確度。

精確的模型表示估算結果彼此相近,例如上述簡單線性迴歸模型的趨勢線圖。然而精確度高,並不保證準確度也高。準確度是評估計算結果有多接近「真實」數值。精確度和隨機誤差有關,而準確度和系統性誤差(或稱為偏誤)有關。 

有效的投注系統,就是要能真正達成目標(即為持續找到能獲利的期望值),它必須同時具備精確度和準確度。「效度」同時包含可預測性和持續性,也就是說我們認為的原因,是否為真正的原因,並且估算結果是否能重複指向此結論。

遺憾的是,許多運彩投注者研究投注記錄時,常誤解精確度、準確度和效度,並且在研究過程中將關聯性和因果性混為一談。他們的錯誤是:相信自己的投注系統「導致」獲利,而在許多情況下,獲利單純只是好運使然。

迴歸分析的陷阱

雖然迴歸分析對於設計投注系統而言是一種很有用的工具,它的潛在弱點是無法分辨關聯性和因果性。迴歸分析可以有效辨認變數之間的關係(例如進球數和失球數,以及比賽獲勝機率),但它無法判斷變數之間的因果性。

迴歸分析可能告訴我們:巴塞隆納輸掉比賽,梅西未進球。然而,我們無法得出梅西未進球,因此導致巴塞隆納輸掉比賽的結論。

如果我們的投注系統未納入因果性和效度,就要注意,和大家使用的預測模型相比,它可能好不了多少。在運彩這種相對來說需要能力的投注中,單純預測未來並不能得到回報,我們還需要勝過其他人才行。

投注資源 - 增進您的投注能力

Pinnacle(畢諾克)的投注資源是線上最全面的專業投注建議資料庫之一。我們的目標就是增進投注者的博彩知識-不論投注者投注經驗多寡。