2008 年亞職賽統一7-11獅隊痛擊 SK 飛龍隊,成為繼 2006 La new 熊後第二支在亞職賽中擊敗韓國的球隊。其中極大一部份要歸功於中華職棒首次為亞職派出的專門情蒐小組。第 312 期的職業棒球雜誌採訪了肩負情蒐重任的馮勝賢與林聿文,其中一句話令我思考。
馮勝賢說,由於他是選手出身,知道球員要的是什麼,因此,情蒐資料力求簡單明瞭,「學術派的數據選手根本不想聽,站在球員的立場想就對了。」
職業棒球雜誌 312 期
馮勝賢會出此言有幾種可能,我能想到的有兩種。第一、過去曾經有人把學術派數據當成情蒐成果給球員,球員覺得毫無用處。第二、可能沒有人拿學術派數據當成情蒐成果,只是球員平常就覺得學術派的數據毫無用處。而讓我深思的是「學術派數據」怎麼會和「情蒐成果」混為一談?而我深深希望馮勝賢說的是第一種情況,而非球員任何情況下都不願理解學術派數據。
讓我印象深刻的「好情蒐」是在「八搶三」比賽轉播中,賽前受棒協委託到澳洲情蒐的球評楊清瓏教練剛說完:「這名球員面對xx球會打成二壘方向滾地球」,接下來的畫面就是二壘手輕鬆傳一壘刺殺打者的畫面。八搶三台灣對戰澳洲和加拿大的兩戰,楊教練的鐵嘴每說必中,而我們球員不論在配球與站位上都輕鬆掌握了對手的特性。
好的情蒐人員比高中比賽場邊的外國球探辛苦得多,外國球探一場比賽只需要注意一兩名球員,而負責國家隊情蒐只要是對手的主力球員都不能放過。在日韓季後賽戰況未明之前更是兩隊的主力通通都要注意。很難想像那種一下要拿碼表一下要拿測速槍的壓力,多數人我想都會手忙腳亂吧。
球賽蒐集資料後,情蒐人員的工作還沒結束,蒐集到的資料要整理,並想出最好的呈現方式對球員才有用。馮勝賢說「知道球員要的是什麼」,從他和楊清瓏的例子看來,短期球賽中進攻選手需要的是「投手的球速與球種」、「捕手配球習慣」、「外野手臂力」。
投捕與守備選手需要的是「打者習性」,其中包括「打者愛打什麼球」,「打者不擅長打什麼球」,「打者會追什麼球」,「打者熱區或冷區」,「打者攻擊落點」,「打者腳程」。
由於去年蔡秉龍對統一投得不錯,賽前獅隊便鎖定他會先發,並針對滑球作攻擊,[馮勝賢表示:]「蔡秉龍一定覺得很納悶,為什麼去年獅隊打不到的滑球,今年卻擊得那麼紮實!」
職業棒球雜誌 312 期
這些情蒐報告也是一種數據。比如打擊「打者攻擊落點」也只是一種機率。拉打球員有的時候也會打到反方向,只是機率較小而已。如何在陌生的情況下,讓選手在短期內了解對手,打起來好像經常交手一樣,應該是國際賽情蒐的最終目的。但是這和「學術派數據」有什麼關係呢?
我不免思考哪些數據是馮勝賢所指的「學術派數據」。是像 OBP上壘率、SLG長打率、WHIP每局被上壘率、ERA+ 這類比打擊率、防禦率略為進階的數據?或是 OPS_win、WPA/LI、EqA、DIP、VORP、Win Share、Base Runs 這類真的很學術的數據?
不論馮勝賢指得是哪一種,對短期國際賽而言這些數據的確不能幫助球員。因為設計這些數據的目的是要幫助球團衡量球員能力或價值。而 sabermetrics 最近非常非常學術派的數據除了幫球團評估球員對過去貢獻外,有些還試著預測球員末來的表現。其中像 VORP、WARP 等衡量球員價值的數據把投打能力甚至守備能力與守備位置都融合在一起,目的是讓球團分析諸如「拿一億簽沙胖值不值得」或是「拿Jose Contreras和現金去換Esteban Loaiza是不是被搶到瞎了」之類的問題。
雖然這類數據在「情蒐」與「短期國際賽」對球員毫無意義,而且這類數據主要是給球團衡量球員,但是並不代表這些數據對球員就毫無參考價值。為了反映球員對球團的貢獻,設計數據的人必須先研究什麼表現對球隊勝負最有貢獻。球員也可以朝提升對球隊貢獻做為長期目標。
情蒐中的資料給選手短期比賽的參考,"學術派"數據卻可以提供球員長期觀念的參考。情蒐中的資料讓選手了解對手,"學術派"數據卻可以讓球員了解自己。好比練肌力是增加爆發力,而練心肺和肌耐力是培養續航力一樣。一種短期就見成效,另一種經年累月才有最大的好處。兩種訓練並無優劣,而且一樣很重要。
數據何嘗不是如此。任何把場上表現具體化的成果多少離不開數據,任何數據都只是一種工具,了解並正確運用較好工具就能帶來進步。希望台灣的球團管理與教練不要拒數據新知於千里之外。也希望因為台灣球團與教練對數據新知的了解可以為台灣球員帶來新的球風與觀念。
相關連結:



這個會不會讓人也聯想到 紅中在之前球迷會中,回答球迷的說辭呢... 這是否也代表球員似乎更相信直覺,而不是經過大量樣本所累積下來的實際證明哩? 總之 明年就曉得了。
如果住南部的話我是會去的。看有前往的球迷拍會後表演的畫面讓人覺得球團真的有在用心。
個人覺得 不難理解爲什麼很多球員看到數據就會怕 畢竟數據如果不經過解釋 對多數人來說只是一堆可怕的數字 如何讓數據變成球員教練能懂的語言 這也是情蒐人員的工作
同意。但是數據表面上難懂只是為了好紀錄而已。如果沒有解釋,只是看到 ERA 或是 AVG ,我想難懂程度應該不下 OPS_win 或 WPA/LI 。其實數據本身也沒那麼重要,重要的是數據整理出來後所帶來的觀念。
最近我也在想這問題:什麼數據符合現在需要?什麼數據有未來?An educated GM看哪個?不看哪個? 和您的原文無關,不過economist JC有篇好樣的: http://www.sabernomics.com/sabernomics/index.php/2008/06/vorp-shmorp/
And JC addressed what you were wondering, "難懂程度"...
提到難懂程度。當然像 VORP 之類的 total stats 比較難懂,但是該文主要在講應該用怎樣的態度來看待 VORP。 VORP 最年來受到嚴格鑑驗後,實際上許多人證明 VORP 在衡量打者能力上有缺陷,它的最大特色就只是把投手和各種位置的選手放在一起衡量而已。也有很多新的數據提供了較準確的衡量。這也是為什麼 JC 會用 "V-bomb" 來形容 VORP,只要有人提起 VORP 不免都會引發一陣筆戰。 我個人覺得數據最難懂的地方在「哪一種數據最能反映真相」。一個數據在設計的時候所用的模型,設定的 baseline 都會影響數據的準確度。好比 VORP 講的是「Value over replacement Player」,怎樣的球員才是二線球員就是一種 baseline 的設定。重要的是知道自己要了解的真相是什麼,才能夠去衡量一個數據準不準、好不好用。 如果使用者對好打者的觀念打很多安打,或是不被三振,那他就會用覺得打擊率高的是好打者。但是數據另一個好處是可以拿來驗證自己的觀念。如果認知球隊的目標是贏球,而得分才是贏球的方法,數據就會顯示有比打擊率更值得參考的東西。 當然那種跑很多迴歸而得到的數據,就是算式裡有很多莫名其妙常數在變數前面的數據,有時不一定比 ERA+ OPS+ 這類算算百分比的數據好。但簡單的數據有時又很難反應球員整體的價值。最重要的還是觀念和知道如何正確的使用吧。 至於 JC 所說的 VORP 只是個術語來表示自己懂得比較多,我覺得他過誇張了。Total Stat 自有 Total Stat 的用處。如果今天討論的是 Jeter 和 Miguel Tejada 誰守游擊對球隊貢獻較大還當然可以不用 Total Stats。但是如果在討論的是 Jeter 拿去換 Santana 或 沙胖值不值得的時候,不用某種 Total Stat 是很難辦到的。 總之,重要的不是數據本身,而是數據背後要說的事。