2018年,MLB裁判共误判34294个好球。带上机器人?
在澳门威尼斯人注册网站研究了四百万场比赛投球后,波士顿大学的澳门威尼斯人注册网站研究人员提出了如何修复破损的棒球系统的建议

红袜队的穆基·贝茨(右)在本垒裁判c·b·巴克诺(左)判他好球出局时,露出难以置信的表情。照片由吉姆·戴维斯/波士顿环球报通过盖蒂图片社
2018年,MLB裁判共误判34294个好球。带上机器人?
在澳门威尼斯人注册网站研究了四百万场比赛投球后,波士顿大学的澳门威尼斯人注册网站研究人员提出了如何修复破损的棒球系统的建议
本文基于美国职业棒球大联盟11个赛季的数据,由波士顿大学硕士讲师Mark T. Williams和一个在数据挖掘、分析和统计方面经验丰富的奎斯特罗姆商学院澳门威尼斯人注册网站研究生团队在两个多月的时间里挑选和分析了400多万个投球。
棒球来了,又是一个惊人的接球、强大的投球、卷尺全垒打、高价啤酒的赛季,是的,还有裁判错过的判罚的电视重播,以令人痛苦的高清慢动作呈现。
美国职业棒球大联盟(Major League Baseball)是时候结束那些被吹掉的判罚——球和好球——所带来的痛苦了。
每个赛季,MLB的本垒裁判都会做出数以万计的错误判罚(请继续阅读支持该断言的证据)。这些可控的错误影响着球员、经理、击球手、投手、表现统计数据、比赛结果,甚至是梦幻棒球的大生意。他们缩短了职业生涯,减少了球迷的体验。游戏节奏也受到阻碍。
但纵观其历史,MLB一直保护其容易出错的裁判,拒绝采用强有力的表现衡量标准,也没有利用现有的技术来改善比赛。在自动驾驶汽车和机器学习的时代,MLB需要接受有用的变革。
裁判的职责是复杂的:在瞬间做出正确的判罚。这是一项对身心都要求很高的工作。2018年,MLB共有89名裁判,他们都是男性,平均年龄为46岁,有13年的经验。每个赛季,裁判员平均参与112场比赛,其中四分之一(28场)是在本垒后面进行的,判罚4200多个球。每场比赛由四名裁判员组成,在四个指定的场地上担任一个裁判(世界大赛除外,使用七名裁判员)。
为了尽量减少不必要的影响,这些游戏分配直到每次计划开始前10到20分钟才会公开宣布。本垒板裁判在比赛中发挥最大的影响力,对任何未击中的球做出判断。目前,裁判员在没有技术协助的情况下发挥这一重要作用。
这种人为元素为游戏增添了色彩,但代价很高:错误太多。2018年,美国职棒大联盟(MLB)裁判共误判34294次,平均每场14次(一局1.6次)。许多裁判远远超过了这个数字。其中一些错误的决定改变了游戏规则。
YouTube上充斥着糟糕裁判的视频。观看这些上传视频本身已经变成了一项运动。诸如棒球史上最糟糕的球、好球、止回球等判罚,以及有史以来最大的裁判失误,都引起了观众的广泛关注。吹罚只会破坏比赛的完整性,减慢节奏,损害平均水平,并阻止运动员最大限度地发挥他们的潜力。
就在2018年全明星赛结束后,科罗拉多落基山队和亚利桑那响尾蛇队在蔡斯球场举行了一场重要的全国联盟比赛。落基队在第九局以6比5领先,但亚利桑那队有两人出局,两人在垒,威胁要卷土重来。韦德·戴维斯,落基队的守门员,以1比2的比分领先于强击手尼克·艾哈迈德。下一个球,一个90英里每小时的切球投向右手击球手的禁区,落在了好球区外。令响尾蛇队球迷难以置信的是,裁判保罗·诺尔特称这只流浪球为好球,结束了比赛。
然而,在分析数据时,考虑到诺尔特在过去11个赛季的表现,这一决定不应该让人感到意外。诺尔特在美国职业棒球大联盟裁判名单上稳稳地排在倒数10位(见图表)。此外,美国职业棒球大联盟的裁判有明显的偏见,大大增加了在两次好球计数中,一个真球被错误地称为好球的几率。2018年,共有55场比赛因裁判误判而结束。
裁判是棒球的核心,每个投出的球都需要至少一个,有时甚至是多个裁判来判罚。然而,尽管MLB已经开始使用内部系统(如Trackman)评估裁判,但他们的表现统计数据并不广为人知,也没有被跟踪或随时共享。球迷可以背出首发投手的信息,但当涉及到谁在本垒板后裁判和他们的错误率时,这些相关的统计数据是不公开的。
为了让这场辩论超越YouTube视频、轶事和球迷情绪,我们采用了临床方法来评估MLB裁判的表现。我们的目标是让数据驱动的证据决定强、弱和新星的表现。并确定裁判在判球和击球时有多准确。
数据不会说谎
在这项澳门威尼斯人注册网站研究中,我们查看了来自Baseball Savant、MLB.com和Retrosheet的游戏数据。所选的时间段是最近的11个棒球常规赛(2008-2018),有超过400万个被称为投球的球。与球员类似,MLB的裁判也被分配了号码,这样就可以很容易地追踪到本垒后面的比赛。所有现役裁判都被纳入了这项性能澳门威尼斯人注册网站研究,他们准确判球和击球的能力被密切观察。所有30个大联盟公园都配备了三角跟踪摄像机,可以跟踪棒球从投手的手中一直到本垒。在每次投球过程中,球的位置可以被跟踪多达50次,精度据称在一英寸以内。美国职业棒球大联盟(MLB)的子公司Statcast是这个系统的核心——在电视转播和直播比赛中使用的击球区图像的支柱。我们从Baseball Savant、Pitch F/X(2008-16)和Statcast数据(2017-18)中填充了所谓的投球和好球区覆盖。
并编制了各裁判员的经验水平和年龄。一旦收集到数据,我们的澳门威尼斯人注册网站研究团队就会使用现有的技术,将好球区与裁判对每个球的实际判罚进行比较,将正确的判罚与错误的判罚区分开来。
在按局、场、月、赛季计算出击球和击球精度后,计算出每位裁判的误判率(BCR)。这个比率是由所有不正确的判罚除以被判的投球总数得出的。BCR得分越高,错误呼叫越多。这个评估过程在每个赛季对每个MLB裁判重复进行。一旦所有裁判员的BCR评分完成,分组和趋势就出现了。然后对裁判进行排序,分为表现最好、一般和最差的三组。应用了标准的数据挖掘、分析和统计方法,并澳门威尼斯人注册网站研究了性能比率。这项澳门威尼斯人注册网站研究得出的结果令人不安。
总结调查结果
这项深入的分析表明,MLB裁判至少有20%的时间会做出某些错误的判罚,或者每五个判罚中就有一个。澳门威尼斯人注册网站研究结果显示出明显的双走向偏差和明显的走向区盲点。经验不足的年轻裁判在他们的巅峰时期通常表现优于资深裁判,而在最近的世界大赛中被选中的裁判也不是表现最好的。结果显示下降,但仍然是不可接受的高BCR得分,但在一个积极的注意,只有一个边际的局间呼叫不一致。调查结果还发现了新的和冉冉升起的明星裁判,并强调了招募表现更好的裁判的迫切需要。
考虑到MLB在评估球员时严重依赖于表现统计数据,令人惊讶的是,联盟在裁判招聘、晋升和保留方面表现迟缓。
下面五个部分将更详细地探讨我们的总结发现。
1
两次击球的偏好球叫做全中
澳门威尼斯人注册网站研究结果表明,在某些情况下,裁判压倒性地倾向于投手而不是击球手。对于有两次好球的击球手,裁判判定真球为好球的几率(29%)是实打实球的两倍(15%)。这些错误率自2008年(35.20%)以来有所下降,但仍然过高。在2018赛季,这一失误率为21.50%,共发生2107次。持续误判的影响包括投手三振率过高和打击率下降。上个赛季,裁判错误地将击球手送回休息区的可能性是误判4球保送的可能性(7%)的三倍。根据对11个常规赛数据的分析,几乎三分之一的打者在看到三振时有很好的理由生气。
这种改变比赛规则的偏见给击球手积极保护本垒板的必要性赋予了新的含义。这也为投手提供了额外的动力来获得早期的两振优势。
当击球手有两个好球时,裁判有偏见的判断:

2
打击区盲点比比皆是
从2008年到2018年,裁判也表现出了一个明显而持久的盲点,在好球带的顶部出现了许多错误的判罚。值得注意的是,在好球区右上方和左上方投出的球,右侧的误判率为26.99%,左侧的误判率为26.78%。虽然裁判的判罚有了明显的改善,但2018年右下角好球区周围的错误判罚仍然达到了令人难以置信的18.25%。数据结果证实,好球区盲点对某些投手的惩罚比对其他投手更大。然而,这一次,打击者从这些错误的判罚中受益,因为好球区缩小了,迫使投手在好球区投出更少的球。对于大多数击球手来说,高打击通常比低打击更难击中。
裁判盲点——好球区上方(左、右):

3
经验不足和年轻的裁判比经验丰富的裁判表现更好
澳门威尼斯人注册网站研究表明,职业裁判和职业棒球运动员一样,有一个标准的峰值。澳门威尼斯人注册网站研究结果显示,2008年至2018年美国职业棒球大联盟(MLB)表现前10名的本垒裁判的平均经验为2.7年,平均年龄为33岁,BCR为8.94%。这些表现最好的人都没有超过5年的工作经验,年龄也不超过37岁。
尼克·伦茨是上榜最年轻的裁判,年仅29岁。从逻辑上讲,考虑到充分完成这项具有挑战性的工作所需的体力要求和所需的反应能力,这一发现不应该令人惊讶。
考虑到标准的峰值,MLB应该考虑放弃传统的四人轮岗,这种轮岗让每个裁判都有时间站在本垒板后面,不管他们是年轻还是年老,经验丰富还是缺乏,也不管他们的表现是强是弱。一个更好的制度是把表现最好的人分配到对体力和脑力都要求最高的岗位。在某一点上,达到并超越了质数,身体和统计数据不会说谎。

澳门威尼斯人注册网站研究发现,与整体表现最好的裁判相比,2008年至2018年美国职业棒球大联盟表现最差的10名裁判的平均经验水平为20.6年,年龄为56.1岁,平均BCR为13.96%。这一组的错误率比美国职业棒球大联盟排名前十的球员高出56%。裁判杰里•莱恩现年61岁,任职29年,BCR最高,为14.18%。这项表现澳门威尼斯人注册网站研究清楚地表明,更多的经验和年龄不一定产生最好的裁判。

与“越年轻越好”相反的观点是,这些裁判缺乏足够的比赛经验来犯很多错误。然而,还有另一个看似合理的原因可以解释为什么新晋裁判往往表现更出色:他们更有动力去证明自己的价值。也有可能是他们受益于老裁判员改进的培训和指导。抛开理由不谈,数据不会说谎:美国职业棒球大联盟(MLB)的年轻裁判正在把球打出界外。
2018赛季,在编制美国职业棒球大联盟十大裁判时,全明星名单中只有2人拥有10年或以上的经验。这些模范裁判的平均经验为6.3年,年龄为37.8岁,BCR仅为7.78%。

2018赛季的表现也有助于说明表现最好的球员(低BCR分数)的紧密分组。请注意,这张桌子是如何明显地向年轻、经验不足的群体倾斜的。相对于第二组的裁判,这些裁判似乎处于巅峰时期。
从2018赛季的情况来看,排名后10位的裁判全部是平均经验23.05年的老裁判,他们的年龄为56.6岁,BCR达到了两位数(10.88%)。在2018赛季,排名后10位的裁判产生的错误判罚比排名前10位的裁判多出40%。

表现结果的图表也突出了一个自然的差异——至少有20年经验的裁判员比那些有10年或更少经验的裁判员做出了更多的错误判罚。在同龄人群体中,也有很多人表现不佳。正如2018年误判率(BCR)图表所强调的那样,这条线描绘了裁判相对于同级裁判的平均表现。线以上的裁判比其他裁判表现得更差。在20年的工作经历中,较高的错误率也很能说明问题。
2018年,泰德·巴雷特和乔·韦斯特是表现最差的球员,分别有495次和512次错误的本垒误判,平均每场分别有17.7次和16.5次失误。如此糟糕的电话号码可能会产生一系列新的结果。例如,错误的叫法可以延长投球数,影响投手轮换和对救援者的依赖。当先发球数越来越深时,一个或两个球可以改变比赛结果。错误的吹罚有利于击球手可以延长局数,并增加得分机会。

有趣的是,安吉尔·埃尔南德斯虽然远未达到突破,但他在2018年的表现比过去11个赛季的平均水平要好。埃尔南德斯经常被MLB球员嘲笑为最差的裁判之一。
我们的数据还展示了2018年新裁判的表现,比如只有32岁、只有1.5年经验的约翰·利布卡(John Libka),他的BCR达到了令人印象深刻的7.59%。以这样低的BCR,他应该赢得“年度最佳新秀裁判奖”。在经验丰富的一方,马克·韦格纳应该赢得“年度最佳经验裁判奖”。两位裁判员都处于他们的比赛的巅峰。
有趣的是,像乔·韦斯特(1978年首次亮相)这样的资深裁判,长期以来一直因为他们倾向于误判而受到球员和球迷的嘲笑。统计数据显示,韦斯特的误判比大多数人都要多。事实上,在过去的11个赛季里,他平均每场有21个错误的判罚,或每局2.3个。安吉尔·埃尔南德斯(1991年出道)虽然也受到了球迷的反感,但即使错误率这么高,他也平均每场误判19次,平均每局误判2.2次,但他的表现比其他球员要好,没有进入2018年美国职业棒球大联盟(MLB)前10名。
不同季节的呼叫变化也是一个问题。埃尔南德斯2017年的表现比2018年差得多。相比之下,乔·韦斯特继续制造了大量令人不安的错误球和好球。
依靠直觉,没有现成的、及时的表现衡量标准,球员和球迷几乎没有能力客观地评估联盟的89名裁判。最近,埃尔南德斯说他每场比赛只有四个误判。正如这项澳门威尼斯人注册网站研究所证明的那样,他的实际错误率几乎是这个数字的五倍。
不幸的是,虽然许多球迷都知道表现不佳的球员的偏好,但当谈到2017赛季帕特·霍伯格和埃里克·库珀的出色裁判表现,或者2018赛季约翰·利布卡和马克·韦格纳的表现时,大多数球迷都被蒙在耳里。
说到世界职业棒球大赛,官方的消息是:2018年世界职业棒球大赛的成绩不是最好的。

在比较了所有裁判的BCR表现后,表现最好的裁判通常不是那些被选为MLB最负盛名、最引人注目、最受追捧的任务的裁判。
在2018年世界大赛的7名裁判中,至少有5名裁判的BCR高于联盟平均水平。2018赛季,美国职业棒球大联盟(MLB)选拔的裁判中没有一名进入前10名。然而,2018年排名倒数10名的泰德·巴雷特(Ted Barrett)却获得了艇长一职。在他二十年的裁判生涯中,这是他第四次被选为季后赛决赛的裁判。MLB的这一决定并非侥幸。2017年,保罗·诺尔特(Paul Nauert)和丹·伊索格纳(Dan Iassogna)也入选了榜单的前10名裁判。在2016年世界大赛中,乔·韦斯特再次被选为裁判,这是他职业生涯中的第六次。

相反,如果美国职业棒球大联盟(MLB)采用以成绩为基础的制度,将2018年世界大赛的任务授予常规赛BCR最低的裁判,那么就会出现一个错误率低得多、判罚一致性高得多的裁判梦之队。

为2018年世界大赛挑选的裁判也往往比联盟平均年龄大得多。考虑到之前发现的年龄和最佳表现之间明显的反比关系,这是有问题的。

MLB只是忽略了有价值的、可用的数据。
尽管有确凿的证据,但每个赛季,MLB都继续保留有问题的球员,其中一些人已经过了巅峰时期。过去三届世界大赛只是最近的例子。一场又一场,一个赛季又一个赛季,表现不佳的裁判仍然在场上。当差错率在最差和最好的球员之间相差高达56%时,谁在本垒板后面就很重要了。2018年,在所有大联盟比赛中,有2%(55场)因错误判罚而结束,比前一年(39场)增加了41%。
考虑到这些游戏的重要性以及正确判断的重要性,MLB必须重新考虑其使用的流程,包括在决定招聘、保留和分配时纳入更多基于绩效的衡量标准。如果联盟真的致力于比赛的改进,它的官员应该积极招募和留住高水平的裁判,就像任何聪明的行业所做的那样。不幸的是,按照目前的资历体系,MLB每个赛季通常只有一两个新的裁判职位空缺。这种有缺陷的制度也阻碍了有前途的人才和冉冉升起的新星获得适当的认可或获得最好的任务。
澳门威尼斯人注册网站研究结果还指出,裁判员的薪酬与表现并不密切相关。世界裁判员协会是代表所有MLB裁判员的工会。有资历的人可以挣到45万美元以上的薪水,而新人的起薪约为15万美元。裁判员享有丰厚的旅行津贴,包括乘坐头等舱。季后赛也有更多的报酬。无论一场比赛是否需要3到5个小时的时间,无论裁判是否做出了2个或20个错误的判罚,裁判员都享有相同的报酬。上一份劳动合同于2015年1月获得批准,2019年底到期。澳门威尼斯人注册网站研究结果支持MLB需要在即将到来的合同重新谈判过程中制定更强有力的基于绩效的衡量标准。仅仅是寿命本身就对游戏造成了伤害。
4
裁判错误率不一致的局只是边缘
澳门威尼斯人注册网站研究结果表明,尽管每场比赛和整个赛季的错误率都很高,但局内误判和好球的不一致性仍然微乎其微。过去11个赛季的数据显示出一种轻微的趋势——前几局错误率较高,中间局错误率较低,关键的第九局错误率略高。当以每个泵为基础剖析初始数据时,有些数据表现出更大的可变性。
每局裁判的不稳定表现:

5
按年计算的不良赎回率
在过去10年(2008 ~ 2018年)中,MLB裁判的平均错误率为12.78%。如前所述,对于某些好球数和投球位置,误差率要高得多。有些年份,错误的赎回率超过了15%。2018年,这一比例为9.21%。尽管美国职业棒球大联盟(Major League Baseball)可能会试图强调这一趋势,将其作为强有力的裁判的标志,但相反,如果有办法通过更好的招聘实践和整合有用的技术来降低错误率,那么就应该采用这些方法。

可能的解决方案
技术
正如这项澳门威尼斯人注册网站研究所表明的那样,糟糕的裁判仍然存在。尽管有多年的数据证据,但美国职业棒球大联盟在扩大年轻裁判队伍方面进展缓慢,错过了迅速降低高得令人无法接受的误判率的机会。联盟在将好球区辅助技术应用到本垒板后方面也拖后腿了。美国职业棒球大联盟(MLB)最近宣布,它将开始测试机器人裁判,但规模很小,将通过与该联盟无关的大西洋联盟农场项目进行测试,此举几乎不加掩饰地试图让批评者闭嘴。MLB现在没有解决这个普遍存在的大联盟问题,而是继续停滞不前。
诸如雷达枪、即时回放、球场图形、多普勒雷达和好球区评估系统等创新极大地改善了棒球和球迷的体验。然而,裁判仍然像100年前贝比·鲁斯(Babe Ruth)称霸、福特T型车(Ford Model T)统治道路时那样,判罚球和击球。科技并不意味着裁判员的死亡。相反,它是一种工具,可以让他们做得更好。
采用好球带技术将使裁判员能够专注于比赛的其他方面,并确保保持比赛节奏。美国职业棒球大联盟在采用创新技术方面一直是追随者,而不是领导者。相比之下,其他职业运动越来越依赖高科技辅助设备、快速通信和集中控制室来改善裁判。在欧洲足球、世界杯和职业网球比赛中,鹰眼技术是标准配置。在美国国家橄榄球联盟(National Football League)中,技术辅助验证日益成为常态。对于足球裁判、教练和四分卫来说,为了实时通信而连接起来也是一种习惯。在国际板球比赛中,裁判员也通过无线通讯技术取得了显著的进步。
Tech-assisted裁判
为了显著改善板后裁判,解决方案不是让棒球引入机器人并解雇裁判员。棒球有太多一次性的情况和复杂性,不能假设机器人可以做任何事情。然而,MLB有一个独特的机会来设定更高的标准,应用性能度量,并加强人与软件的协作。为了推动这一进程,世界裁判协会需要承认现有的裁判缺陷,接受更强有力的基于表现的方法,并支持创新的技术解决方案。
与中央控制系统相连的裁判员可以很容易地戴上耳机或耳机,传送实时的球和击球信息。这些裁判可以正确、快速、毫不费力地做出判罚。历史悠久、深受喜爱的车牌后面的标志、信号和声音不会受到干扰。裁判员将保持控制,在某些情况下具有超越能力,例如如果球在穿过本垒板之前击中地面或发生系统中断。
偏见将被消除。好球区主观性将被最小化,为投手释放更多的空间,让击球手更多地专注于击球,而不是猜测不一致的好球区。游戏节奏会加快。这也会减少裁判对球员和教练的指责。
结论
美国职业棒球大联盟(Major League Baseball)的目标不应该是抵制改变,而应该是坚持按照自己的规则明确规定的官方好球区——在每一球上。高科技辅助设备和更多招募有能力的年轻裁判是另一个重要步骤。想象一下球员和球迷的体验,以及如果每年超过34000个错误的判罚消失,棒球会是什么样子。球迷们可以更多地关注那些杰出的裁判和冉冉升起的新星,并为那些能够经受住时间考验的老兵鼓掌,就像人们欣赏那些最优秀的老球员一样。

认为本垒裁判在没有辅助的情况下能够集体达到体育产业和应得的球迷日益要求的准确率是不现实的。鉴于裁判达到了标准峰值,招聘和保留政策需要相应调整。采用更强大的基于表现的系统与现成的技术相结合,可以在尊重先进技术带来的好处的同时,保留游戏中的人性化元素。至少,使用技术辅助的方法不会产生比我们现有的MLB裁判更糟糕的结果。
马克。T. Williams(奎斯特罗姆93届)是波士顿大学奎斯特罗姆商学院的詹姆斯·e·弗里曼管理学讲师,在那里他教授金融技术和创新课程。您可以通过Williams@bu.edu与他联系。作为一名终身的棒球迷和几本体育书籍的作者,他要感谢杨天阳、布兰登·科恩和波士顿大学学生团队的其他成员所做的巨大贡献,他们都是理工科和数学金融学硕士。
评论与讨论
波士顿大学缓和评论,以促进知情的、实质性的、文明的对话。辱骂、亵渎、自我推销、误导、语无伦次或离题的评论将被拒绝。版主在正常营业时间(EST)有澳门威尼斯人注册,只能接受用英语写的评论。统计数据或事实必须包含引文或引文链接。