第一部分 賠率篇
五、賠率的數學模型。
(一)基礎數據模型。
在西方,成規模的博彩業已經有了200多年的歷史,湧現出了許多建立在嚴格的數學統計基礎上競技比賽結果的預測方法,根據我們掌握的資料,有三種權威的預測方法目前被廣泛地應用於預測足球比賽的勝負平結果,有一些專家甚至聲稱,歐洲幾乎所有的博彩公司都在這三種預測方法的基礎上建立起數學模型,從而決定本公司在一場足球比賽以前開出怎樣的初始賠率。
這三種被廣泛應用的權威預測方法是:一、埃羅(ELO)預測法;二、進球率比較預測法;三、六場戰績比較預測法。
1、埃羅預測法:
埃羅預測法是美國物理學家Aroad Elo博士創立的,Elo博士最早將這套方法用於預測國際象棋的比賽結果。他在自己的《棋分高下:過去和現在》一書中對該方法作了詳細說明,通過對1500場英超比賽的研究,傑奎斯·布萊克對Elo預測法進行了不懈地改進,現已經被廣泛應用足球賽事中。Elo預測法的改進模型是通過研究主客場球隊在比賽前的積分情況來預測勝負的,Elo預測法的預測回歸方程式為:
主場球隊取勝的可能性 =44.8%+(0.53%乘以兩隊積分差)
客場球隊的獲勝可能性=24.5%+(兩隊積分差乘以0.39%)
這兩個回歸方式的得出過程如下:
首先,根據數學專家的研究表明,足球比賽中主客場雙方實力的發揮似乎有一個「限度」,如果用埃羅預測法中的雙方的分之來表示其實力的話,那麼當將主場球隊的優勢設定為其實力的7%,而將客場球隊的優勢設定為其實力的5%時,應用埃羅預測法所預測的結果與實際比賽結果最為接近;而「限度」即為7%+5%=12%。
(1)比賽限度。
根據德拉普金和弗西斯的研究結果,如果比賽雙方的賽前得分均為100分的話,主場球隊的優勢為7分,而客場球隊的優勢為5分,而「限度」為7+5=12分;該12分誰贏「贏家通吃」;而如果兩隊的比賽出現平局,則兩隊就各得6分。
該方法的具體應用如下(假定兩隊賽前分值均為100分):
如果主場球隊勝,則主場球隊在賽後分值調整為105(+100-7+2),而客場球隊分值調整為95(=100-5);
如果客場球隊獲勝,則客場球隊的賽後分值調整為107(=100-5+12),而主場球隊分值調整為93(=100-7);
如果比賽以平局告終,則主場球隊的賽後分之調整為99(=100-7+6),而客場球隊賽後分之調整為101(=100-5+6),而客場球隊賽後分值調整為101(=100-5+6)。
也就是說,主場球隊在賽前的積分超出客場球隊越多,主場球隊在比賽中取勝的可能性就越大。
(2)積分差與主隊獲勝的關係。
我們根據線型回歸的方式,可得知相關係數(R)顯示「積分差」與「主隊獲勝」二者之間的相關性非常顯著,相關係數經運算得出為0.42。也就是說,主場球隊取勝的原因,有42%可以用主場球隊和客場球隊在賽前的積分差來解釋。當然,主場球隊取勝的原因仍然有58%需要用積分差之外的其他因素來解釋。儘管如此,對1,500多場比賽(用統計學的術語來說,就是1500多個樣本)進行分析,得出的0.42相關係數無論如何都表明相關性是極其顯著的。
通過回歸方程,還可以找出二者之間具體的數量關係,即y=0.0053x+0.448,其中,x為主客場隊之間的積分差,y主場球隊取勝的可能性。
(3)積分差與客隊獲勝的關係。
和上面所說相同,賽前的積分差與客場球隊獲勝的可能性之間的相關係數(R)為0.45,表明兩者之間顯著相關。也就是說,客場球隊取勝的原因有45%可以用比賽雙方的賽前積分差來解釋,其回歸方程為(y=-0.0039x+0.2452)
上述分析表明,如果參賽雙方的積分相同,客場球隊取勝的可能性為24.5%;如果參賽雙方積分不同,那麼客場球隊的積分比主場球隊的積分每高一分,客場球隊獲勝的可能性就增加0.39%;而主場球隊的賽前積分比客場球隊的積分每高一分,客場球隊獲勝的可能性即下降0.39%,由此,我們得出了開篇時的兩個預測回歸方程式。
(4)積分差與平局之間的關係。
埃羅積分能夠得出主客勝的關係,那是否能得出平局的關係呢?經過研究,引人注目的是參賽雙方的積分差與出現平局的可能性之間沒有顯著的相關關係。不論採用線性回歸的方式,還是採用非線性回歸的方式,都無法得出二者的顯著相關的結論。線性回歸的相關係數(R)為0.048,而採用非線性回歸方式相關係數(R)也僅為0.079,從統計學上來說,這樣的相關係數是沒有意義的。因此,無法判斷出積分差與平局出現的可能性之間的關係,這是埃羅預測法的局限所在。
2、進球率預測法:
在1990年的倫敦國際博彩會議上,大衛·傑克遜和K.R.莫捨斯基提交了一篇名為《比賽中的指數博彩》的論文。在該論文中,他們認為某場賽事的結果是與參賽球隊在以往的進球率有關係的,因此可以通過考察參賽球隊以往的進球率來預測比賽結果。具體方法如下:
以Ra表示參賽的A隊以往的進球率,以Rb表示參賽的B隊以往的進球率;則本場賽事的總進球數即可以用Ra+Rb來預測,而兩隊的勝負則可以用Ra-Rb來預測。
傑克遜和莫捨斯基在論文中還以1990年7月在意大利舉行的世界盃比賽中英格蘭隊對愛爾蘭隊的比賽為例,對他們的理論的應用進行了檢驗。
英格蘭隊在主要國際賽事中平均進球率為1.29,而愛爾蘭隊的平均進球率是0.73。應用他們的方法,英格蘭隊勝愛爾蘭隊的可能性為0.56(=1.29-0.73),而預測的「總進球數」為2.02(=1.29+0.73)。賽前指數博彩公司開出的英格蘭勝的指數為0.85-1.1,總進球數指數為2.1-2.4。因為總進球數指數與應用這一方法所得出的預測結果很相近,所以在這方面下注贏彩機會幾乎沒有。不過,英格蘭勝的指數最低為0.85,比起運用傑克遜-莫捨斯基方法得出的預測數字0.56要高出很多,這就意味著賣出這一指數是有利可圖的。
這場比賽以1-1的平局告終,給賣出英格蘭勝指數的下注者帶來的利潤是0.85X單位賭注。對該場比賽而言,傑克遜和莫捨斯基的預測方法是很準確的,但遺憾的是他們沒有進一步給出將該方法運用於其他比賽的例子。
該方法的特點是看來很有道理,而且應用也簡便。但該方法主要適用於指數博彩,對於我國目前只競猜「勝、平、負」的方式來說,並不適用。但其用進球率來預測比賽結果的方法,值得我們借鑒。
(1)平均進球率和球隊實力之間的關係
採用平均進球率來對比賽結果進行預測,首先必須回答的一個問題是平均進球率和球隊實力之間是否存在一定的關係。如果二者之間並不存在相關關係的話,則根本無法用平均進球率來進行預測。
我們認為,積分榜排名在相當程度上代表了球隊的實力。表2-1是2000—2001賽季英超和意甲最後的排名和各隊的平均進球率。按照傑克遜和莫捨斯基的定義,平均進球率的計算方法是:平均進球率=某隊總進球數/該隊比賽場次數。表2-1中各隊的平均進球率是該隊在2000-2001賽季的總進球數除以比賽場次數的結果。例如,曼聯在2000-2001賽季總進球數為79個,比賽場次數為38場,故其平均進球率為79/38=2.08。
表2-1球隊積分榜排名與平均進球率名次
英超聯賽 意甲聯賽
球隊 平均進球率 球隊 平均進球率
1 曼聯 2.08 羅馬 2.00
2 阿森納 1.63 尤文圖斯 1.79
3 利物浦 1.84 拉齊奧 1.91
4 利茲 1.68 帕爾瑪 1.50
5 伊普斯維奇 1.50 國際米蘭 1.38
6 切爾西 1.79 AC米蘭 1.65
7 桑德蘭 1.21 亞特蘭大 1.12
8 阿斯頓維拉 1.21 佈雷西亞 1.29
9 查爾頓 1.32 佛羅倫薩 1.56
10 南安普頓 1.05 博洛尼亞 1.44
11 紐卡斯爾 1.16 佩魯賈 1.56
12 托特納姆熱刺 1.24 烏迪內斯 1.44
13 萊切斯特 1.03 萊切 1.18
14 米德爾斯堡 1.03 雷吉納 1.00
15 西漢姆 1.18 維羅納 1.18
16 埃弗頓 1.18 維琴查 1.09
17 德比 0.97 那不勒斯 1.03
18 曼城 1.11 巴裡 0.91
19 考文垂 0.95
20 布拉德福德 0.79
我們對各球隊在積分榜上的名次與平均進球率之間的關係進行了相關分析,結果如圖2-1所示。從相關分析可以看出,積分榜名次與平均進球率呈負相關關係。且對英超而言,二者的相關係數為0.8743;對意甲而言,二者的相關係數為0.8410,均為顯著相關關係。
因此,我們可以得出結論,平均進球率在一定程度上代表了球隊的實力,可以用平均進球率對比賽結果進行預測。
(2)預測準則
足球比賽結果的預測像對其他任何事情的預測一樣,不可能做到完全準確,我們所能做的是努力提高準確率。對於利用平均進球率來預測比賽結果而言,具體應該考慮三個因素。
a、球隊的實力
球隊的實力在此是用平均進球率來表示的,因此,平均進球率越高,則表明球隊實力越強。但對任何一場賽事而言,實力強大的球隊並不總能取得比賽的勝利。這也就是我們經常說的「足球是圓的」的道理。
例如2000年12月9日,英超2000—2001賽季中曼聯客場與查爾頓主場的比賽。曼聯的實力顯然要超出查爾頓,從實力而論應該是曼聯贏,可結果卻是雙方3:3戰平;又如該賽季2001年5月5日曼聯主場對考文垂的一場比賽,無論從實力上講,還是從地利上講,都應該是曼聯取勝,可結果卻是曼聯以0:1敗北。
同樣的例子屢見不鮮。2001的1月14日,2000—2001賽季意大利甲級聯賽羅馬主場對巴裡,羅馬隊即有主場之利,實力又遠勝於巴裡,從道理上講應該是羅馬隊贏,實際比賽結果卻是雙方以1:1戰平。
因此,球隊實力是決定比賽結果的重要因素,但不是唯一因素。
b、主客場的影響
主場球隊由於得地利之便,取勝的可能性要大於客場球隊。
我們對2000—2001賽季英格蘭超級聯賽和意大利甲級聯賽的統計結果的分析充分說明了這個問題。如表2-2和表2-3所示。
表2-2英格蘭超級聯賽2000/01賽季結果
總場數 主場勝 客場勝 平局
場數 比例 場數 比例 場數 比例
380 184 48.4% 95 25.0% 101 26.6%
表2-3意大利甲級聯賽2000/01賽季結果總場數 主場勝 客場勝平局
場數 比例 場數 比例 場數 比例
306 143 46.7% 75 24.5% 88 28.8%
從表中可以看出,英格蘭超級聯賽,主場勝的比例為48.4%,而客場勝的比例僅為25.0%;意大利甲級聯賽主場勝的比例為46.7%;客場勝的比例為24.5%。
主場取勝的比例高於客場取勝的比例是一個規律,與球隊的實力似乎沒有關係,幾乎任何一個球隊的主場勝率都高於其客場取勝率。
c、其它因素
除了球隊實力和主客場因素外,還有許多因素會對比賽結果產生影響,例如球員的競技狀態、傷病情況等等,在此不再贅述。本著上述原則,經過反覆檢驗和調整,對於平均進球率預測法而言,我們發現用下面的規則對英格蘭超級聯賽和意大利甲級聯賽進行預測的結果是準確率最高的。
準則1、當參賽雙方的平均進球率之差為0.30(不含0.30)以上時平均進球率高的球隊勝;
準則2、當參賽雙方的平均進球率之差為0.10以上至0.30(含0.30)時,若主場球隊的平均進球率高,則主場球隊勝;
準則3、當參賽雙方平均進球率之差為0.10以上至0.30(含0.30)時,若主場球隊平均進球率低於客場球隊的平均進球率,則主場球隊勝或平。
準則4、當參賽雙方平均進球率之差為0.10(含0.10)以下時,主場球隊勝或平。
這四個預測準則既考慮了球隊實力,又考慮了主客場因素。因為各隊經過10場比賽之後的平均進球率才能夠真實反映球隊的實力,所以平均進球率的使用,一般是從第11輪開始的。另外需要說明的是,由於每場比賽後,各隊的平均進球率會發生變化,因此該指標能夠動態地反映球隊實力
值得著重指出的是,用平均進球率對比賽結果進行預測時,必須要根據球隊上一場比賽中的進球情況對其平均進球率進行調整;調整後的進球率才能作為預測的依據。例如某球隊在前10場比賽中共進球15個,則在預測其第11場比賽結果時,所應用的平均進球率是15/10=1.5;若第11場比賽,該隊又攻進對手1個球,則在預測其第12場比賽時,其平均進球率就應調整為(15+1)/11=1.45。
3、六場預測法:
六場預測法是英國的報紙傳媒提供給廣大彩民的簡單的預測方法。英國的報紙每週都會刊登下周足球賽事,並將每個參賽隊最近六場的比賽結果以表格的形式刊登出來。按照時間順序,勝一場以一個「W」表示,輸一場以一個「L」表示,平一場以一個「X」表示。
該方法進行預測的假設前提是認為在足球比賽中一個球隊的某種近期趨勢會延續下去。例如,如果主場作戰的球隊已經連續贏了六場球,即其近期六場比賽的結果為WWWWWW;而客場作戰的球隊已經連續輸了六場球,即其近期六場比賽結果為LLLLLL;則預測結果就是主場球隊贏。同樣,如果參賽的兩個球隊在最近的六場比賽中平了四場,例如,最近六場比賽結果為XWXXLX,則極有可能這兩個隊在即將開始的比賽中也會以平局告終。
(1)六場預測法的問題及改進。
上述六場預測法的理論基礎雖然有一定的道理,但在實際應用中卻存在以下幾個問題:
首先,在實際賽事當中,很難出現兩個比賽球隊之間恰好是WWWWWW對LLLLLL的情況,在2000/01賽季當中,英超和意甲從第七輪開始的560場比賽中,這種情況一次也未出現過。
其次,在應用六場預測法進行預測時,很難找出預測的規則,因此,使得其應用受到極大地限制。
例如,2000年12月16日,切爾西對米德爾斯堡的一場比賽。按照六場預測法,賽前切爾西隊的前六場比賽結果是LXLLWW,而米德爾斯堡的前六場比賽結果是LLLXLL,按照六場預測法的理論,這種趨勢會持續下去的話,則該場比賽的預測結果是切爾西勝,但實際結果卻是米德爾斯堡勝。
另外,像2001年2月3日利物浦對西漢姆的比賽,賽前六場兩隊的比賽戒分別是利物浦為WLWWXX,西漢姆為LWLLXX,即兩隊在該場比賽之前,均有兩場平局,應該預測該場比賽為平局嗎?實際結果是利物浦勝。
六場預測法的合理之處在於將一個球隊的近期表現考慮在內,而其不足之處如上所述,因此有專家對六場預測法進行改進,使得它更便於應用。
改進的具體方法為,將某場賽事之前兩支參賽球隊的近期六場表現轉化為一定的數值,兩支球隊各自的數值代表了其近期狀況和實力,而兩隊之間該數值的「差」即表示了近期表現和實力的差距,進而可以根據該差值來判斷比賽的勝負。
具體的計算方法為:借用英格蘭超級聯賽和意大利甲級聯賽的積分計算方法,某場賽事之前某球隊六場的比賽結果中,每勝一場(即一個W)計為3分,每平一場(即一個X)計為1分,每負一場(即一個L)計為0分。如若某隊某場比賽之前的六場全贏,即按照六場預測法為WWWWWW,則該隊得分為18分;若為LLLLLL,則計為0分:若是WLXXWW則計為11分。
(2)預測準則
六場預測法同樣要考慮球隊的實力和主客場等因素制,在此不再詳述。我們用上述經過改進的六場預測法,對英格蘭超級聯賽和意大利甲級聯賽2000/01賽季從第七輪開始的560多場比賽進行了預測,得出如下預測準則:
準則1當對賽的兩隊六場積分差為6或6以上時,六場積分高的球隊勝;
準則2當對賽的兩隊六場積分差為5時,若主場球隊六場積分高,則主場球隊勝;若主場球隊六場積分低,則主場球隊勝或平;
準則3當對賽的兩隊六場積分差為2—4時,則六場積分高的球隊勝。
準則4當對賽的兩隊六場積分差為1或0時,則主場球隊勝或平。
(3)六場預測法的準確率
a、總體準確率
英格蘭超級聯賽從第七輪開始共預測321場,其中有182場預測正確,準確率為56.7%。
意大利甲級聯賽從第七輪開始共預測252場,其中有136場預測正確,準確率為54.0%。
b、各段準確率
英格蘭超級聯賽六場積分差為6或6以上時,準確率為42.7%;六場積分差為5時,準確率為70.6%;六場積分差為2~4時,準確率為51.2%;六場積分差為1或0,準確率為77.5%。
意大利甲級聯賽六場積分差為6或6以上時,準確率為48.1%;六場積分差為5時,準確率為57.1%;六場積分差為2~4時,準確率為41.9%;六場積分差為0或1時,準確率為78.0%。
對於英超而言,明顯低於總體準確率的是六場積分差為2、7、8及10以上時;對於意甲而言,明顯低於總體準確率的是六場積分差為2、3、8時。
而英超六場積分為2、7、8及10以上的場數占總場數的比例為27.7%;意甲六場積分為2、3、8的場數占總場數的比例為30.9%。也就是說,對於英超而言,可以較準確地預測72.3%的比賽;對於意甲而言,可以較準確地預測69.1%的比賽。因此,六場預測法應用於英超比賽,每一輪的10場賽事中,可以較準確地預測7場;而應用於意甲比賽,每輪9場賽事中,可以較準確地預測6場。
本文所闡述的這三種模型,都是從比賽本身的角度來探討賽果,也可以說是一種模仿博彩公司通過模型得出賠率的過程,與博彩公司所開出的賠率自身並無直接聯繫。但我們可以發現,博彩公司的賠率模型,從理論上而言,也是基於這三個客觀數據模型而建立的,發現其共通之處,自然對我們瞭解比賽的進程,得出比賽賽果大有裨益。