二月 20, 2017
二月 20, 2017

如何驗證預測者記錄的可信度

方法 1:研究停止點賠率

方法 2:Wald–Wolfowitz 隨機連串檢定

如何驗證預測者記錄的可信度
所有預測者都保證自己能提供有品質的預測和高額彩金。但對於決定採用其預測的投注者而言,在下注之前需要先回答一個重要的問題。這名預測者是運氣好或精通此道?在這篇文章中,Joseph Buchdahl 提供兩種方法,幫助您自行找出這個問題的解答。繼續閱讀,瞭解哪種方法最適合您。

Pinnacle(畢諾克) 先前已探討如何評估預測者能力以及如何驗證投注記錄來證明預測技術超越運氣。但當您取得預測者看似可靠的記錄時,您如何得知這會是一筆好的投資交易?讓我們來看看吧。

複習 t 檢定

我們先前已討論過 t 檢定能如何幫助您驗證預測技術,方式是計算一系列投注恰好獲利的機率。機率越低,代表受到其他因素(例如預測技術)影響的可能性越高。然而,當投注記錄看起來過於夢幻,我們可能會得到一個不同的結論:這是一份假造的記錄。

讓我們回顧一位專精大小盤和比賽賠率市場的線上足球預測者,他宣稱能提供客戶「有品質的預測、良好的賠率和高額彩金」。從 2013 年 8 月到 2014 年 10 月,在提交他的預測給著名的預測者調查服務之前(此後便因管理不善的指控而中止),其預測共有 296 筆,獲勝的平均期望值是 50%,平均賠率是 2.04。其中 220 筆為獲勝,預測成功率為 74%,投資報酬率為 151%。獲利表看起來像這樣:


tipsters-evalution-1.jpg

此記錄的 t 分數是 9.3,代表隨機發生此獲利率的機率大約是一百萬兆分之一。您應該要對這種極低機率的情況,以及幾乎不可能發生的完美獲利趨勢提高警覺。然而這種預測結果無法證明預測者作弊。他仍有可能是超級天才預測者。那麼,我們要如何驗證這個問題?

方法 1:研究停止點賠率

Mirio Mella 先前已討論過市場變化的重要性。賠率會隨著投注者下注的方式而變動,反映出投注者可獲得的隊伍或球員消息。特定隊伍或球員的優勢越大,其賠率變小的可能性就越高。 Dafni Serdari 也解釋過為什麼停止點賠率很重要。

「在比賽開始前公布的賠率稱為停止點,會反映所有的統計、新聞、投注活動和市場的走勢。停止點應當是市場效率的高點,因此最能表現潛在的或然率。」

能穩定擊敗停止點賠率的人,就會被視為精明的投注者。他們把資訊帶進市場,反映出他們降低賠率的能力。如果他們穩定擊敗停止點賠率的程度能超過利潤,這就象徵期望值是正值,這有助於辨別贏家和輸家,或者說辨別專家和菜鳥

我已經分析過大量開始和停止點賠率的樣本。結果明確顯示,只要依據擊敗停止點賠率的利潤就可以輕易預測獲利期望值。例如,如果您以賠率 2.20 投注一支隊伍,而停止點賠率是 2.00,您的預期優勢就是 10%(減去利潤)。

我們「有品質的預測者」能穩定擊敗停止點賠率嗎?當獲利期望值為 51% 時,我們應該預期 2.00 的賠率會減少 51% 加上利潤,變成大約 1.30。和 Pinnacle(畢諾克)共同檢視此預測者最新的 20 筆預測後,我們從研究樣本得到以下結果。

  •        8 筆賠率減少(平均 6.7%,最高 19.5%)
  •        7 筆賠率提高(平均 3.5%,最高 7.1%)
  •        5 筆持平
  •        平均變化是減少 1.5%
  •        標準利潤是 2%

這個結果和隨機並沒有統計上的顯著差異。此預測者並未以任何系統性方式改變 Pinnacle(畢諾克)的市場。真的,他影響賠率的程度甚至低於利潤。顯而易見,他當初提供投注預測時,Pinnacle(畢諾克)完全沒有注意到這件事。

方法 2:Wald–Wolfowitz 隨機連串檢定

第二種驗證預測者投注記錄可信度的方式是 Wald–Wolfowitz 隨機連串檢定。此方法是以 Abraham Wald(發現倖存者偏差的統計學家)和 Jacob Wolfowitz 命名,此檢定用於判斷一組二元資料序列是否為隨機過程所產生。

不論預測者的技術造成任何影響,一連串輸贏的序列仍應反映記錄當中的潛在隨機雜訊,因為序列中每一筆投注都不受前一筆投注的影響。毫無預測技術的預測者所建議的等額投注,結果會和連續擲硬幣一樣。預測成功率 74% 的預測者可以用正面和背面機率為 74:26 的加重硬幣來表示。出現正面的機率是背面的三倍,但序列分布仍會是隨機的。

考慮以下連續的勝負:

勝 勝 負 負 勝 負 勝 勝 勝 勝 負 勝 勝 負 負 負 負 負 勝 勝

共是 11 勝 9 負,並觀察到 9 筆連串  (Ro),連串的定義是連續的勝或負(包括只贏或輸一次)。要判斷這組序列是否為隨機,就需要計算 11 勝 9 負的連串期望值,並比較期望值和觀察到的連串次數。差異越大,序列為隨機的可能性就越低。在序列為隨機的(虛無)假設之下,連串的期望值 (Re) 是:

tipster-evaluation-2.png

W 和 L 分別是勝和負的次數。可能出現連串的分布大約是常態分布,標準差 (σ) 為:

tipster-evaluation-3.png

 

接著我們計算檢定統計量 (Z),定義為:

tipster-evaluation-4.png

最後,我們將它轉換成機率(p 值),它代表連串的觀察值和期望值差異為隨機產生的機率。在 Excel 當中,可以使用 NORMSDIST 功能,這和使用我自己的連串檢定計算器一樣。p 值越小,勝負序列為隨機並具統計獨立性的假設就越不可能成立。通常假設不成立的 p 值 = 5% (Z = 1.96) 或有時為 1% (Z = 2.58)。

上述序列的 Re = 10.9、Z = 0.88 和 p 值 = 38%,我們可以得到此序列為隨機的結論。

連串檢定有效的前提是假設每一筆投注結果有相同的機率(如同擲硬幣)。雖然每一筆預測的賠率不盡相同,因此通常情況並非如此,但在賠率大致相同時仍不會有太大的問題。

亞洲讓分盤和賽點讓分盤的賠率範圍都在 2.00 左右,因此通常適用。對於我們分析的預測者,96% 預測的獲勝機率在 40% 到 60% 之間,78% 預測的獲勝機率在 45% 到 55% 之間。所以他預測記錄的連串檢定結果如何?

  •        預測次數 (n) = 296
  •        勝 (W) = 220
  •        負 (L) = 76
  •        連串觀察值 (Ro) = 135
  •        連串期望值 (Re) = 114
  •        Z = 3.21
  •        P 值 = 0.1%

根據這些結果,我們可以明確得知此序列為隨機的假設不成立。對於 74% 預測成功率、平均賠率接近 2.00 的預測者而言,連串的次數遠比期望值來得高。仔細研究後就能發現隨機檢定為何不成立:較短的連串過多,較長的連串過少。

tipster_5.jpg

[至少 x 勝的連串期望值大約是 nqpx,p = 獲勝期望值 (74%),q = 1 – p (26%)]。 

例如至少連續 2 勝出現 67 次,相較之下期望值是 56。相反地,至少連續 8 勝的連串只有 2 次,而期望值是 7。 

隨機性的迷惑 

如果此預測記錄並非隨機,那麼它是什麼?最簡單的解釋是它經過假造。因為較短獲勝連串的次數過多,預測者可能常常以插入失敗結果的方式來中斷較長的獲勝連串。為什麼? 

我們受到稱為集群錯覺的認知偏誤所影響,很容易把隨機分布產生的必然連串或集群誤認為有意義的結果。 因此人們建立隨機二元序列時,如果感覺勝或負出現的次數太頻繁,大多數人都會把勝負互換。

我們的預測者顯然認為太長的獲勝連串看起來不自然,但事實正好相反。事實上,在獲勝期望值 74% 的 296 筆預測序列中,我們通常應該至少看到一個 15 勝連串,而他的最長獲勝連串是 11,以及一個 9 連串和兩個 7 連串。 

過於夢幻?

如果預測者的記錄看起來過於夢幻,很可能真的如此。在購買之前,先驗證它是否能擊敗停止點賠率和序列是否隨機。如果兩者皆非,就把錢省下來做別的事吧。

關於這位「有品質的預測者」,針對其最近預測的另一份分析顯示他仍完全無法影響 Pinnacle(畢諾克)的市場。而且現在我們發現他會變更過去的預測記錄,也許是以插入一系列失敗預測的方式,讓預測記錄看起來較為自然。再次進行 Wald–Wolfowitz 連串檢定就能判斷他是否仍被隨機性迷惑。如果他被迷惑了,千萬別像他一樣。

投注資源 - 增進您的投注能力

Pinnacle(畢諾克)的投注資源是線上最全面的專業投注建議資料庫之一。我們的目標就是增進投注者的博彩知識-不論投注者投注經驗多寡。