子曰:不得中行而與之,必也狂狷乎。狂者進取,狷者有所不為也。

[魔球觀點] 別濫用數據

很久沒有嘴運動數據這東西了。

這次就來看一下最近一些關於NBA數據有關的文章吧,然後來說一下,個人心中數據的解讀方法。


到2011年為止,NBA奪冠年齡與平均數的對照 pic via http://www.paulvanslembrouck.com

首先,我們從Bleacher Report評比NBA傳奇球星Top 100 No.1~10(運動視界)這一篇文章開始。

這篇文章引了"Bleacher Report"的報告來對傳奇球星做評比。評比內容就不寫出來了,重點在於這份評比根據的是許多的「進階數據」,包括像是晉級貢獻度、季後賽表現…等非紀錄台所紀錄的數據。這些數據可作為評量的依據當然是毋庸置疑的,但問題是這種數據忽視了運動的不容易量化的面向:對手。

與棒球一球一球投出不同,籃球(或其他團體球類)很明顯地,會受到戰術產生隊形漏洞所影響。(參看魔球觀點的籃球比賽)很多時候我們會在看球時聽到"mismatch",攻擊球員對上非對位球員的例子。一般來說,籃球基本的對位是相應的,產生"mismatch"的現象就會產生防守上的可趁之機。

大攻擊小→吃身高、噸位
小攻擊大→吃速度、犯規

大致上是這樣的原則。也就是說,得分與對位者的防守相互影響是還沒有做出有系統的紀錄與整理(或至少沒人去挖),以導致現在很多的得分數據都將對手是誰忽略掉了,而單純地用「得分」作為概括代表。(不過也很難定義得分時的防守球員到底是誰)這樣做的好處是計算方便;但壞處是球隊攻防體系的影響則會消失,無法看出球員真正的價值,例如擅長於用速度翻弄、用噸位強迫取分…的特性。

即便如此,這樣的數據方式依然有一定的「參考」水準。因為原則上只要把聯盟內所有球員放在同樣的評量標準內,就多少具有可參考性。




球員的說法

從《魔球》一書問世以來,以數據評估球員常常會落入「打球又不是在算算術」的迷思內。實際上場打過球的人就大概知道,球場內會需要考慮很多的因素,其中有很多更是難以量化的關鍵,例如球員的心態、防守的評估…,而這些在互動性相當強的運動中,受到心理影響的判斷有時可以決定一場比賽的走向,甚至於產生令自己懊悔的結果。所以很多人(尤其是看重這種因素的人)常常會認為用數據分析只是沒辦法上場打球的人在瞎忙而已。

但真的是這樣嗎?

如果你是真的打過球的人,大概會贊同這種說法;如果你是對數據有興趣的人,大概不會認同。如果你沒打過球,也對球場數據沒興趣的話,你根本無感;但若你實際打過球,也對數據有感覺的話,那你會發現,這種說法對也不對。

對的是這種說法點出了現在的數據觀察系統還有很多可以改進的空間。例如前面所提的對位角色、取分模式、心理狀態…等,最關鍵的在於防守極難量化。籃球是團隊運動,當陣型產生變化時,不代表就這樣就一定會被對方得分,因為還有「補防」的機制存在。用前面的例子來說

大攻擊小→吃身高、噸位→低位打入時,後方防守球員可能會把球抄走
小攻擊大→吃速度、犯規→禁區可以做口袋戰術,將攻擊球員包圍住製造失誤

諸如此類都顯示,籃球基本上與棒球不同,是一種「動態賽局」(dynamic game),而非「靜態賽局」(static game)。對棒球來說,每一次play的判斷點相對有限;但在籃球來說,每一次下球都可能是影響整個局面的動作,也就是說雙方球員不斷地在進行博奕。這是我認為籃球在做數據統計時需要跨過的方法論上的障礙。

但這不代表數據於籃球完全無用,而是你必須知道如何進行隊伍的規劃,數據才有可能發揮作用。近代籃球開始三分線的投射能力,基礎就是根據期望值所進行的推論。




超越數據迷思

個人不能認同單純「感覺派」的數據無用論;也不能完全認同數據派的「信數據得天下」。以個人觀點來看,數據的重要性在於「要切合競爭環境」,而不能設定單一指標來進行評估。打個比方,一個攻大於守的禁區球員如果放到注重防守的攻防體系之下,那麼他的能力就沒有展現的空間。那麼數據基本上是無用的。

看出來了嗎?如果你是球探,那麼你要知道的是「在你們隊上,關鍵的數據指標是什麼」,並且根據這樣的指標配合建軍戰略完成隊伍建設,這樣的數據才是有意義的。

無意義的數據則是指收集公仔那樣,將一堆大牌明星放在同一隊裡面,這就不是數據的意義,甚至也不是原本《魔球》想說的事情。

《魔球》要告訴我們的是,數據可以當成一種工具,幫我們找出適合自己隊上的球員。這其中的關鍵就在於你如何了解你的競爭環境,設定戰略,完成建軍而進入比賽

不要被數據迷惑,也不要鄙視數據,這只是一種分析工具而已。

messi

View more posts from this author

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

你可以使用這些 HTML 標籤與屬性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>