2022年世界盃有多讓人震驚?日本擊敗德國有那麼讓人出乎意料嗎?Joseph Buchdahl將會解析這些資料,來看看大型賽事中的大冷門是不是真的如我們所想的這麼讓人出乎意料。
根據德國運動元數據公司Gracenote指出,2022年卡達世界盃是冷門隊伍們大放異彩的一屆,有15場比賽都爆冷門(依據該公司的定義),是64年來比例最高的一年。
卡達世界盃是64年來最充滿驚奇的世界盃
不過,這數字到底有多讓人感到出乎意料,以及到底在什麼條件下才叫做爆冷門呢?
大多數人應該都同意日本擊敗西班牙和德國,以及沙烏地阿拉伯擊敗阿根廷都算是大爆冷門,不過這都是因為我們十分相信西班牙、德國和阿根廷應該要贏下這些比賽。
直觀來說,我們可能會覺得這很理所當然,不過我們不可能確切知道真正的結果為何,我們應該隨時都要留意異常的發生。
當足球賽事的結果看似讓人感到驚訝時,是因為這些(透過精準的預測模型所認證的)冷門隊伍走了好運,還是因為這些冷門隊伍其實不是冷門隊伍,而是預測模型出錯了呢?
哲學上來說,這是個很有趣的謎題,也很難解開。在這裡,我們將會討論兩種不確定性。
預測模型有效性中的不確定性或異常被稱作「認知不確定性」,理論上,可以透過更優良的模型來減少這種情形。
另外一種是本質上的不確定性,被稱作「隨機不確定性」,也常被稱作機率、運氣或是隨機性。
這種不確定性是無法減少的。認知不確定性與隨機不確定性兩者很難明確區分。在這兩篇Pinnacle文章中,我希望能夠稍微盡一點力說明。在這第一篇文章中,我會試著探討整體在世界盃中令人感到驚訝的事件。
在第二篇文章中,我會以世界盃為資料,來測試其效率;我會解釋這些結果如何讓我們更加了解博弈業者的投注賠率準確性(或效率),以及他們仰賴的預測模型有效性有多好。
64場比賽的多重機率
如果我們預測每場世界盃比賽三種可能的90分鐘結果機率,我們能建立一個64場比賽的多重機率,顯示所有可能的結果組合。不過我們應該要用哪種結果機率?
大部分想得到好結果的投注者們一定都有他們自己的計算方法,不過為了節省時間,同時也知道那就是最好的機率,我會使用Pinnacle的關盤投注賠率。
我已經在好幾個地方詳盡討論過為何Pinnacle的關盤賠率最適合拿來預測真正的機率結果。
Pinnacle很明顯有將利潤加入這些賠率中,所以我得先把它們去掉。我有自己的計算機可以這麼做。
然後我們就能用這些多重機率來試著回答這個問題:2022年世界盃的結果整體而言有多讓人驚訝?
敘述的謬論
我們值得花點時間來理解,在64場世界盃比賽中要完全沒有爆冷門的機率其實是微乎其微。
全都是熱門隊伍獲勝的機率為11%
透過Pinnacle的關盤賠率,我計算出就90分鐘後的結果來說,這是6.5 x 10-17,可以說是只比一百萬兆分之一還要高一點點的機率。
如果成真了,反而會成為人類歷史中最驚人的事件之一。
不過,我懷疑除了統計學家以外的人們是否會對此予以關注,我想大多數人可能只會把它當作非常無聊世界盃的證據吧。
而其他每個64場比賽多重機率(可能性有很多,是三的64次方,準確來說是3,433,683,820,292,512,484,657,849,089,281)的機率都比較低。
其他每個機率都包含了爆冷門(如果我們將爆冷門定義為熱門沒有獲勝的話),而多重機率越小,爆冷門的次數就越多。
不過,只有一個方式才能一場爆冷門都不出現,那就是所有熱門隊伍都獲勝。相較來說,有許多方式能爆冷門。個別來說,它們的64場比賽多重機率可能會比較低,不過總體而言,會比一場冷門都不爆的機率還要高。
考量十場比賽(每場比賽有兩種可能結果)的簡單二項式分佈樣本,每場比賽中熱門隊伍都有80%的獲勝機率,而每支冷門隊伍都有20%的獲勝機率。
所有熱門隊伍都獲勝的機率為11%,不過有20%的機率有三支冷門隊伍勝出,而四支冷門隊伍獲勝的機率甚至還有9%。
機率為什麼會那麼高?個別來說,機率僅有0.17%和0.04%(分別是特定的三支或四支冷門隊伍獲勝的機率),不過有很多方式能造成這個結果,由三支冷門隊伍獲勝有120種方式,而四支則是210種。
換句話說,是很有可能會爆冷門的。不過,很多時候,我們的大腦會依據資料來創造出一個簡單,有時候甚至是完美的故事;打造出一個想像中更難爆冷門的世界。
如果日本沒有擊敗西班牙和德國,我們並不會因此大作文章,但數據告訴我們這些出乎意料的結果其實在統計上是合理的。這就是敘述謬論的例子。
蒙地卡羅機率分佈
審視在64場比賽多重機率中發生6.5 x 10-17機率的方式是固定的。最不可能發生的多重機率是所有冷門隊伍都獲勝,機率為1.5 x 10-51,要達到如此低的機率也只有這種可能。不過,有多少方式能預見,像是10-25或10-30等多重機率的結果呢?
要用一般的算法處理這種計算太複雜了。為了輕鬆一點,我們可以建立一個蒙地卡羅模擬。
透過根據Pinnacle提供的機率將比賽結果隨機化,我們可以創造出一個隨機產生的64比賽多重機率。
重複這個大數數次,計算每個被定義的機率發生了幾次,我們就能定義概似性機率的分佈。也就是說,我們可以定義64場世界盃賽事可能結果的範圍與機率。
處理微小的可能性價值,直覺上來說很困難。不過,我們可以進行一個小小的變化,使其比較容易理解:那就是計算它們的對數。
舉例來說,0.001的對數(基數為10)是-3;0.000001是-6,而0.000000000001是-12。事實上,根據我的需求(基數為e),我會使用自然對數(ln),並且我會去掉負號。
我的蒙地卡羅模擬包含了十萬次計算,得到了每個隨機化64場比賽多重機率的十萬個自然對數值(去掉負數)。
將這些數值再次分類,我將它們繪製成下列的頻率(或機率)分佈圖表。
這個圖表的X軸完整範圍為37.3(64場全都是熱門隊伍獲勝)至117.1(全部都是冷門隊伍獲勝),不過我們都知道其可能性微乎其微。
事實上,只需要列出最有可能出現的結果,就能欣賞何謂可能性的範圍。看看這個圖表,我們可以看到,64場比賽多重機率中,有很大的機率X軸的值會落在45至75之間。
相對應於多重機率,分別大約為3 x 10-20和3 x 10-33。
隨著X軸往右側移動,多重機率會隨之降低。平均值,或者是說最有可能觀察到的多重結果X軸數值為60,對應多重機率則是7.5 x 10-27。
同樣繪製在圖表上,以垂直黑線所代表的,則是我們觀察到的實際世界盃多重機率結果。其X軸值為63.5(多重機率為2.7 x 10-28)。
這比最有可能出現的多重機率結果大約低了28倍。
聽起來很多,不過這張圖表可不是這麼說的。您能看到,這並不偏離機率分佈的中心點(平均值)多遠。事實上,大約20%的可能世界盃多重機率都小於實際發生的這個多重機率。
數據上來說,我們不能稱之為出乎意料。如果要出乎意料的話,至少要把垂直線移動到至少X軸值為70的地方,代表只有少於1%的可能多重機率會發生。對應多重機率則是大約4 x 10-31,或是比實際發生的多重機率小了大約700倍。
要發生這種事的話,就需要看到像是卡達擊敗荷蘭、波蘭擊敗法國,或是南韓擊敗巴西等事件。
這是一屆很出乎意料的世界盃嗎?
根據我在文章中呈列的數據,我們現在可以回答一開始的問題。
不,並不那麼出乎意料。是的,在各個比賽中的確有出乎意料的爆冷門,不過我們現在知道了,在有那麼多場比賽的錦標賽中,這是很有機率會發生的。的確,如果一場冷門都沒爆的話,反而會更出乎意料。
不過,哲學上來說,出乎意料到底是什麼意思呢?這都攸關起初對比賽結果的期望為何。
這是一個很極端的例子,我的預測模型顯示威爾斯是擊敗英格蘭的大熱門,迦納是擊敗葡萄牙的大熱門,澳洲是擊敗法國的大熱門,哥斯大黎加是擊敗德國的大熱門,諸如此類,64場比賽中都有。
我可能會對最後的結果感到十分驚訝。是因為我的預測模型所顯示的冷門隊伍走運了,還是因為我的預測模型錯了嗎?
就這個例子來說,這很明顯,不過通常兩者之間的差別會更加微小。
Pinnacle預測的比賽可能性並沒有完美地預測出最後的結果。是因為運氣不好,還是因為模型有錯呢?
這就很難說了。不過,也許我們可以說是因為Pinnacle的預測和真實世界的賽事間並沒有顯著性差異,所以能大膽爭論Pinnacle的預測模型並沒有那麼糟。
換句話說,世界盃(根據Pinnacle的觀點)的結果,就數據上來說並不特別出乎意料。出現這個結果的機率,比最有可能出現的世界盃結果還要低(實際出現的爆冷門可能還會少個兩、三場),不過並不低多少。
如果有顯著性差異,那就可以很輕鬆地反駁Pinnacle的觀點。
所以,我們可以制訂一個原則:預期和實際結果的差異越大,預測模型數據出錯的機率就越大。Pinnacle的世界盃賽事預測模型與其他博弈業者相較起來如何?這就要留到本系列的第二部份了。
註冊Pinnacle以在各式各樣的盤口中獲得超棒的足球賠率。記得要在投注資源查看Joseph Buchdahl其他資訊豐富的文章。