十一月 2, 2015
十一月 2, 2015

如何使用自助抽樣法解決資料限制的問題

如何使用自助抽樣法解決資料限制的問題
當賽季才剛開始時,如果沒有足夠的資料可以做出可靠結論怎麼辦?在這篇文章中,Dominic用兩個範例解釋了如何使用自助抽樣法來減少因為樣本過小造成的任何參數錯誤。

一個預測足球的主要方法是卜氏分佈,我們已在之前的Pinnacle文章中說明過。在此深入瞭解如何使用卜氏計算預測足球投注。

這個方式基本上是根據主場隊伍的攻擊力和客場隊伍的防禦力來確定主場球隊的預期平均比分。 這同樣也適用在計算客場的預期平均比分。

不過,在賽季一開始,使用這個方法會遇到困難,因為我們沒有足夠的比賽可以取樣。另外,如果我們遇到情況極端的比賽,像是高比分的比賽或一連串無進球的比賽,都會影響我們的期望值。

我們絕對會有大量的參數錯誤您可在 這裡瞭解如何建立體育博彩模型的更多資訊。

一個測量參數錯誤數量的方法是使用自助抽樣法。自助抽樣法是一種我們需要自行編造樣本大小的解決方案。

在撰寫文章時,多數的英超隊伍打過的客場和主場比賽都少於5。

為了示範,我可以推薦兩個方法。

方法1:直接方法

這個方法需要用替代數值進行取樣,也就是選取同樣數值多次來創造類似的樣本規模。

以萊斯特城到目前為止的主場賽事為例,他們對上阿斯頓維拉、西漢姆、阿森納和水晶宮分別進了3、2、2和1球。這個樣本每場主場進球平均值為2。 

現在讓我們t使用這些值建立四個進球數的隨機樣本。這與從Monte Carlo模擬法建立隨機值相同。因此額外的樣本組為:

  •       樣本1:2、2、2、1
  •       樣本2:1、1、3、2
  •       樣本3: 3、3、2、2
  •       樣本4:1、2、1、1

請注意,進兩球比進一球或進三球更有機會被抽到,所以在每個案例中我們應該要有不同的平均值,不是每次都是二。

在這個情況下,每個樣本的平均分別為1.75、1.75、2.5和1.25。我們認為平均是2,但我們的值顯示出範圍在1.25到2.5之間。

我們也可以進一步透過計算大量不同自助取樣值來檢視結果的標準差

方法2:盡情發揮

針對萊斯特的比賽,我們可以建立一個期望比分。這可以用與卜氏算式相同的方式產生,只是使用前個賽季的資料。

我們以與阿斯頓維拉的比賽為例。英超2014/15 賽季的主場進球數平均為1.474。萊斯特在19場主場比賽中進了28球,而阿斯頓維拉在19場客場比賽中失掉32球。

這讓萊斯特的攻擊力為1,這代表了他們在主場表現普通。另外一方面,阿斯頓維拉的平均失球為1.684。

如果我們將其除與1.474,我們會獲得114.29%,這代表了阿斯頓維拉在客場出賽時失球數比一般情況多了14%。如此一來,萊斯特在主場對上阿斯頓維拉的預期比分平均為 1*1.1429*1.474 = 1.684。 

只要在他們的所有比賽重複相同的流程,每場比賽的預期比分如下表所示。在這裡我們可以看到,除了對上水晶宮以外,萊斯特的表現一直超前,進球數多於預期。

這會顯示在差異這一欄,它的專有名詞為殘差值。

球隊 阿斯頓維拉 西漢姆 阿森納 水晶宮
期望比分 1.684 1.526 1.158 1.263
實際目標 3 2 2 1
差異 1.316 0.474 0.842 -0.263

跟方法1相同,我們已經用一些殘差值的取代值取樣。因此,可能的取樣殘差值為:

  •       樣本1:1.316, 1.316, 0.474, 0.474
  •       樣本2:0.474, -0.263, -0.263, 0.474

我們現在將這些樣本殘差值加到期望比分,以取得主場得分的樣本:

  •       樣本1:3.000, 2.842, 1.632, 1.737
  •       樣本2:2.158, 1.263, 0.895, 1.737

每個樣本都有自己的平均值,我們可以用其運算主場隊伍的平均得分,以取得不同的參數。

結論

這並不是完全的粗估算式,但您不需要擁有額外的程式知識。善用您的試算表,您可以測試各種不同的參數。不過請記得,如果您使用上方第二個方法,您會需要分析客隊期望比分的殘差值。 

strategy-openaccount.jpg

投注資源 - 增進您的投注能力

Pinnacle(畢諾克)的投注資源是線上最全面的專業投注建議資料庫之一。我們的目標就是增進投注者的博彩知識-不論投注者投注經驗多寡。