MLB美國職棒大聯盟預測分析觀察技巧-統計數據背後的錯誤迷思
如果我們很簡單的將舊金山巨人先發投手Matt Cain(7勝-13敗)
與密爾瓦基釀酒人先發投手Claudio Vargas(10勝-4敗)
兩人本球季的戰績拿來相比較,
很多人就會認為Claudio Vargas所帶領的密爾瓦基釀酒人將比較容易贏得比賽。
但事實上,Claudio Vargas最近5場的先發僅贏得一場比賽,
反倒是Matt Cain以2.36的低投手防禦率拿到3勝1敗的佳績。
對於MLB美國職棒大聯盟來說,要預測一場球賽的勝負,
投手球季中的累計勝負場數據,通常無法有效的反應一名投手最近的現況表現。
當然,這只是一個簡單的例子。
我們今天就來探討幾個常被拿來作為預測球賽的數據,
為大家揭開這些數據背後常帶給人一些錯誤的迷思。
ERA(Earned run average)投手自責分率
對於預測一場比賽的勝負而言,它依據的是選手最真實可能的比賽演出,
但如果這些數據是一直被累計加總計算,這項數據將無法有效反映出一名選手的近況。
一名在拉斯維加斯的顧問Korner就曾指出,他在做賠率分析時,
對於ERA這項數據從來不加以重視。原因就在於ERA這項數據,
統計的基礎在於設定每名先發投手是以投滿九局來計算,
而這根本無法客觀的判斷一名先發投手在一場比賽中的投球表現,
因為通常一名先發投手都以投滿七局作為設定,所以他認為ERA在球賽預測分析上,
根本就是一項毫無用處的數據。
他認為ERA沒有效用的原因在於,
ERA的計算方式是投手失分數除以投球局數再乘以九局,
而不是投手失分數除以正常的投球局數。以Korner的理論舉例來說,
一名先發投手先發6局丟掉3分的自責分(在棒球統計中算是一場優質先發),
他的投手自責分率為4.50 ERA,通常我們認為這樣的自責失分率偏高。
如果我們將他修正以7局來計算,這樣投手防禦率就會成為3.50 ERA。
而這更能夠充分反映出先發投手的實際表現,
這樣的數據在預測大小球上反而更佳的精準。
BA(Batting average)平均打擊率
通常許多人會把BA來當作打擊者或球隊與投手間的主要對戰優勢比較,
不過BA就如同ERA一樣,容易帶給預測者產生許多錯誤的迷失。
舉例來說,雖然亞利桑那響尾蛇本季全隊的平均打擊率僅.247(國家聯盟最差),
上壘率也很差僅.316,平均每場比賽也僅可以得到剛好超過4的分數,
不過令人詫異的是,如果你從球季開始,每一場都押響尾蛇贏,
到目前為止響尾蛇在拉斯維加斯賭盤獲利率上是位居第二高獲利的球隊。
原因就在於平均打擊率這個數字,並沒有辦法真實的反映出球隊及球員的狀態,
在數字的背後還隱藏許多造成球隊致勝的因素,以亞利桑那響尾蛇來說,
他的平均打擊率雖然不高,但他的XBH(extra-base hits)【註一】為392、SB%(stolen bases)
盜壘成功率為81%、SF(sacrifice flie)高飛犧牲打為51(國家聯盟最高),
還有他們很少擊出雙殺打。
註一: XBH(extra-base hits)是指非一壘安打的數量,
例如一個球隊累計擊出39支二壘安打、9支三壘安打及14支全壘打,
我們就可以算出XBH=39+9+14=62。
因此,這也指出如果大家過分仰賴於單一數據,
這是絕對無法正確顯示出實際的比賽狀況的,
而這也使的大多數人非常容易讓造成判斷與分析上錯覺。
相信這樣說明大家就可以知道,要正確預測一場球賽的勝負,
在不考量其他外在的變動因素下,光是統計數據就足以誤導大家的思維,
事實上這樣的數據迷失當然不只出現在上數的兩個統計數據上,
還有很多的數據也是如此....。