用预期进球数衡量门将扑救能力?数据先行者已做好筛选工作

  • 时间:2024-08-12 09:57:39|
  • 来源:看球直播

在《数据无法决定金球奖,但能看出哪位前锋真的很厉害》一文中,我们引入了“预期进球”这个数据,并试图用它初步量化前锋的射门能力;那么,我们能否用预期进球来量化守门员的扑救能力呢?很遗憾,这样做很可能会产生巨大的误差。原因在于,守门员的扑救只有在射正的情况下才有意义,因此,大部分的射门没有射正,与守门员无关。

以本赛季英超联赛为例:20支球队38轮比赛共进行了9635次射门,其中只有3311次射正,占比仅为34.36%,用总射门次数的预期进球来衡量门将的扑救水平,显然会引入不少干扰。

不过,欧美的数据先驱们早已做好了筛选工作,他们在统计门将数据时,会筛选掉所有射门命中目标的射门,重新计算每一次射门的得分概率,这个系统被称为“预期失球数”(XCG),简称“XCG”。

最重要的是,XCG的计算方式和我们熟悉的“预期进球”截然不同:它考虑到射门的角度是否刁钻——一般来说,朝着球门正前方的射门,肯定不如直接朝着传说中的“十点角”射门有威胁;而传统的“预期进球”只考虑射门时射手的位置和角度是否偏大,这不仅导致XCG和“预期进球”的进球数不同,更重要的是,对两次射门得分概率的量化可能形成对比。我们来看下面的例子:

英超门将最快进球_英超门将直接进球_英超门将绝杀

斯特林近距离射门被扑出

英超门将最快进球_英超门将直接进球_英超门将绝杀

萨拉赫远射破门

以上两次射门,情况截然不同,均由凯帕打进。对于前锋来说,哪种射门更难?显然是萨拉赫的远射,预期进球系统认为这球更有可能进。进球的概率只有4%,而斯特林的射门则达到了25%;不过,显然萨拉赫的射门要棘手得多。

所以对于凯帕来说,萨拉赫的高质量远射其实更加难以应对——XCG计算出,斯特林的近距离射门得分概率为48%;而萨拉赫的射门得分概率却达到了59%。

所以现在我们有了一个高级统计数据,叫做 XCG,它结合射门位置、角度和它们瞄准的球门区域,量化所有射正的数学期望。结合守门员实际丢球数,我们可以量化守门员扑救的射门次数。这里我们引入一个“限制对手射正率”的概念,量化守门员在每次射正中能将对手的射门转化为进球的概率降低到何种程度。公式为:

限制对手射正率=(XCG-实际失球数)/对手射正次数*100%

我们以最近两个赛季作为样本,选择了几名守门员,并主要根据这些数据来考虑守门员。

1 辛苦一年,一夜回到解放前——埃德森

英超门将绝杀_英超门将最快进球_英超门将直接进球

埃德森的传球能力毋庸置疑,而他在联赛层面的扑救水平在过去一年也有了很大的提升,上赛季他实际丢球数比XCG高出3.94个,对手扑救率-4.75%,其实是一个不尽人意的水平;不过本赛季该数据已经变成了正数,这意味着他已经是一位远超平均水平的优秀门将。

这里尤其值得注意的是,曼城对手的射门质量在不断提高。

17-18赛季,曼城在攻防两端都建立了强大的统治力,对手的每次射门XCG仅为0.266;18-19赛季,埃德森面对的每次射门XCG达到0.303,这非常明显,较少的高质量射门比较多的低质量射门对门将的威胁更大。

考虑到这一点英超门将最快进球,埃德森在联赛中的进步还是相当可观的,要知道,本赛季曼城对手的反击占比高达11.11%,是英超最高,埃德森的射门有相当多被扑出,下面是快攻:

英超门将绝杀_英超门将直接进球_英超门将最快进球

还有一些不太容易用数据量化的场景,比如进攻破坏对方的快攻:

英超门将直接进球_英超门将最快进球_英超门将绝杀

不过,在欧冠层面,埃德森的位置却很尴尬:近两个赛季,他限制对手射门的频率严重不尽人意,尤其是本赛季,他甚至出现了“退一步”的情况。

-8.10%的对手投篮率限制是我们本次选取的所有样本中最差的。

为什么说“一夜之间回到解放前时代”呢?因为其中两场比赛的影响实在太大了。我们来看看埃德森的XCG和10场欧冠实际失球数的差距变化:

英超门将直接进球_英超门将最快进球_英超门将绝杀

那么第5场和第10场的分差就尤其尴尬了,都超过了-1,说明埃德森这两场比赛本应该多扑出对手的射门。

其中第5场是小组赛2-2战平里昂,第10场则是被热刺淘汰的比赛,其实这两场比赛埃德森并没有犯下什么低级失误,问题是对手的两次射门其实很准,而且完全是在防守覆盖范围内打进的:

英超门将绝杀_英超门将最快进球_英超门将直接进球

对阵里昂,埃德森被对手挫败

英超门将最快进球_英超门将直接进球_英超门将绝杀

孙兴慜对阵热刺的射门被埃德森腿弹开

这两个进球从射门机会上来说其实都很不错,尤其是第一个,是面对门将的一对一射门,问题就在于射门所追求的角度都比较直——这也是XCG数据的特点非常能体现的地方:它默认的要点是,如果对方有很好的射门机会,但射门本身太直,质量又一般,那么门将就应该扑住。

2. 德赫亚的急剧下滑

“前场漂亮,后场德赫亚”,本赛季之前,这并不是一句空话。为什么是本赛季之前?因为从去年世界杯开始,德赫亚就突然崩盘了。

德赫亚在17-18赛季的扑救能力到底有多恐怖?他无论是联赛还是欧冠,限制对手射门和破门的比率都达到了惊人的8%。要知道,曼联在穆里尼奥手下从来就不是一支进攻能力极强的球队,上赛季他们之所以能稳居前四,就是因为丢球比曼城多。

但两支球队整体的防守质量其实完全不一样:曼城能把对手的预期进球数压低到24.21,是英超最低的;曼联呢?他们对手的预期进球数高达42.99,严格来说也只是英超中上水平。球队的水准如此之高,以至于他们只比德比对手多丢一球,可见德赫亚的重要性。

然而世界杯让德赫亚彻底从炙手可热的球星变成了昏天黑地的球星,这位刚刚迷迷糊糊回到国家队的西班牙门将在刚刚过去的一个赛季里一下子从神坛跌落到了凡间。%对手射门得分率只能说是门将平均水准——这是赛季中期曾经爆出的数据,从稳定性上来说,本赛季的德赫亚也算是他多年作弊的结果,球队输得彻底。我们来看看联赛中实际失球数与XCG差值的走势:

英超门将绝杀_英超门将最快进球_英超门将直接进球

我不是在责怪德赫亚,但是这走势也太不稳定了吧?赛季中期的好比赛他能把这个数据打到+2,坏比赛就直接降到-1.5……最近几场比赛到底怎么了?德赫亚面对一些远射有点手足无措:

英超门将绝杀_英超门将直接进球_英超门将最快进球

英超门将直接进球_英超门将绝杀_英超门将最快进球

英超门将最快进球_英超门将直接进球_英超门将绝杀

当然你可以说德赫亚的视野被遮挡了,对手的射门太快了,他来不及反应,但至少在XCG算法中,这两项都没有被考虑进去。

不过话说回来,本赛季之前,德赫亚已经面对过很多次这样的射门,而且他都能扑出很多。XCG认为他状态下滑是有理由的。

另外值得注意的是,德赫亚所在的曼联本赛季问题重重,整个赛季38场联赛中对方射正次数高达186次,遥遥领先于我们评选的其他门将。

虽然这并不能说明对方每一次射门的质量有多高,但却引出了另一个问题:如果我们假设门将有一定的概率遭遇一些不幸的意外情况,那么显然射正次数更多的门将德赫亚更有可能遭遇这些意外。例如:

英超门将直接进球_英超门将最快进球_英超门将绝杀

沙奇里射门,但皮球弹到目标上,德赫亚没能阻止

当然,德赫亚恐怖的反应速度还是有的,这样的门将在某些比赛中还是能够贡献拼命的表现,尤其是在面对对方的近距离射门的时候,德赫亚有时候的反应速度简直让人难以置信,这也是我们相信他的下滑不是永久性的,状态终究会恢复的原因。比如:

英超门将绝杀_英超门将直接进球_英超门将最快进球

英超门将直接进球_英超门将绝杀_英超门将最快进球

3. 联赛最佳门将——阿利森

英超门将最快进球_英超门将绝杀_英超门将直接进球

是的,你没看错,经常被诟病“不甘寂寞,在门线上玩火”的阿利森,其实是近两年联赛中最稳固的一环,利物浦的后防线本赛季有了长足的进步,靠的不仅仅是范戴克,阿利森的贡献或许更大。要知道,范戴克去年年初才加盟球队,而阿利森则是夏天的针对性补强。

这次签约对于利物浦来说会有多大的影响呢?我们可以先看看阿利森的两位前任卡里乌斯和米利奥莱的表现。

17-18赛季,克洛普几乎担心门将问题,米尼奥莱和卡里乌斯在联赛中各出场一半,结果两人在联赛中限制住了对手的射门率。负数:米尼奥莱-4.98%,而卡里乌斯只看起来稍微好一点,为-3.34%——为什么我说只“看起来稍微好一点”呢?

因为卡里乌斯所面对的射门质量其实比前者要低很多,在对手的射正XCG从0.331降到0.285的前提下,实在无法限制对手射正率的提升,也没什么太大的进步。

而且这还只是在比较不错的联赛中,欧冠赛场上,卡里乌斯作为主力出战,结果如何?他13场全勤,将对手的射门率限制在了耸人听闻的-9.68%……这意味着什么?好吧,2016-17赛季,有一个叫布拉沃的“射门王”,让瓜迪奥拉很郁闷,他对手的射门率只有-7.98%……

阿利森呢?罗马并不是一支顶级防守球队,17-18赛季阿利森在37场意甲比赛中被射正149次,XCG为43.3,但他通过大量高接球成功封堵射门,将失球数降至28个,将对手的射门率限制在恐怖的10.27%!

这比德赫亚那个赛季还要高!凭借超快的反应和地面速度,阿利森经常可以挡住射向两个底角的射门,这正是 XCG 以更高的进球率默认的。射门方式:

英超门将最快进球_英超门将直接进球_英超门将绝杀

尤其是在罗马遇到一些喜欢渗透的技术型球队而陷入被动局面时,阿利森的近距离扑救有时候会起到力挽狂澜的作用,比如当赛季意甲客场4-2战胜那不勒斯的比赛,阿利森竟然让对手16次射正却只进了2球,像这样的精彩扑救还有很多:

英超门将最快进球_英超门将绝杀_英超门将直接进球

利物浦招募这样一位门将,是一笔利润丰厚的交易。

阿利森本赛季继续贡献不俗,限制对手射门得分率高达8.72%,遥遥领先于英超其他所有门将。虽然利物浦的防守不太可能像罗马那样给阿利森太多机会,但作为一支热爱抢断的球队,球队难免会错失对手的快攻(对手反击率位列英超第三)。这时候,就需要阿利森站出来拯救球队了:

英超门将直接进球_英超门将最快进球_英超门将绝杀

这里需要注意的是,对于利物浦这样一支丢球次数并不多的球队来说,一旦考虑到欧冠赛场,将比赛样本进一步缩小,那么这组关于“限制对手射门率”的数据可能会出现严重的失真。

最大的问题是,它在考虑射门角度的同时,却忽略了射门的客观情况——如果你离球门很近,甚至面对空门,那么将球往前推其实是比打死角更安全的选择。然而,这种朝球门前沿的射门,会被XCG系统误认为进球概率很低。阿利森的欧冠数据就因此受到影响:

英超门将绝杀_英超门将最快进球_英超门将直接进球

因西涅的射门其实距离必进球并不远,但由于他选择打中球门中心,XCG 仅为 0.21

4、最稳定的球员:特尔施特根

提拔特尔施特根的决定或许是近年来有些奢侈且略带盲目的巴萨做出的最正确的决定之一。两个赛季以来,巴萨从来都不是顶级防守球队,中场拦截能力也不行,球队在欧冠赛场上屡屡受罚,但特尔施特根为球队在联赛中失球数少做出了巨大贡献。

这个人最大的优点就是稳定性——我们选出的门将中,特尔施特根是唯一一个在两个赛季的联赛和欧冠比赛中限制对手射门率都为正值的门将之一(另一位我们后面会讲到)。

对于巴萨球迷来说,无需再强调特尔施特根有多么重要,从某种程度上来说,说他是继梅西之后巴萨第二重要的人也不为过。

这里真正有意思的是英超门将最快进球,特尔施特根近两个赛季在欧冠赛场上的表现波动很大:17-18赛季,他在欧冠赛场上的排名仅次于德赫亚;而到了19-20赛季,他的排名出现了压倒性的优势。而造成这种情况的原因,和欧冠赛程有很大关系。

欧冠赛程的一大特点就是赛程比较集中,要知道,漫长的赛季下来,球员状态出现起伏也是很正常的事,如果球员状态好的时候恰逢欧冠赛程集中期,那么他很容易在欧冠赛场上打出亮眼的数据;相反,如果球队恰好在欧冠赛场上状态低迷,那么不仅数据会下滑,还有可能导致球队直接被淘汰,没有任何补救的余地。

我们来看看特尔施特根近两个赛季在联赛中限制对手的射门得分率,就能明白为何他在欧冠赛场上的表现会形成鲜明对比了:

英超门将最快进球_英超门将直接进球_英超门将绝杀

英超门将直接进球_英超门将最快进球_英超门将绝杀

注意红色圈出的区域,这大概是欧冠比赛比较集中的时间段了,特尔施特根在这两个赛季这两个时间段的表现差别很大,18-19赛季的良好表现几乎正好集中在这个时间段,球队在欧冠赛场上限制对手的射门次数达到了6.73%,这也就不足为奇了。

还有一点值得注意:我们用来计算对手射门率的公式中,分母就是对手的射正次数,这导致我连续两个赛季在计算特尔施特根的数据时,出现了无效值。因为有些比赛,巴萨的对手全场没有一次射正……这也是此次事件中其他门将都未能做到的。

无论巴萨在欧冠赛场的出局有多么丢脸,他们在联赛中的统治地位是必须被肯定的。

如果要给特尔施特根本赛季的代表性扑救数……对不起惨不忍睹的皇马,国王杯上特尔施特根只对皇马踢了两场,已经给足了老对手面子了,原本指望维尼修斯保住希望的皇马球迷,现在都绝望了……

英超门将最快进球_英超门将绝杀_英超门将直接进球

5.本赛季最佳门将,遗憾在欧冠失利——奥布拉克

奥布拉克本赛季的表现有多夸张,相信很多西甲非马竞球迷都体验过被他支配的恐惧。

除了阿利森在17-18赛季令人难以置信的联赛表现外,奥布拉克8.87%的限制对手射门率是我们所选样本中最高的。

此外,奥布拉克还凭借身高优势,在时常送给对手定位球的马竞,取得了别人难以企及的数据:他整个赛季一共尝试拿球61次,而别人最多只有50次。

事实上,奥布拉克很可能已经是马竞的头号球星,他对球队的重要性甚至可能比格列兹曼更大。

要知道,本赛季马竞其实已经跌出了顶级防守球队行列,对手的预期进球数41.57个也只是西甲倒数第三(一年前,这一数据是西甲最好的35.71个),在去年的基础上又有了进一步的进步,马竞本赛季的联赛第二名位置或许就不那么稳固了。

英超门将直接进球_英超门将最快进球_英超门将绝杀

此球看似简单,但实际上XCG高达0.69

射手所追求的角度其实非常棘手,之所以看上去简单,很大程度上是因为奥布拉克可以利用身体优势轻松覆盖球的运行路径。

巴萨也经历过类似的情况,比如下面这球,库蒂尼奥试图利用弹跳球绕过门将,却被身材高大的奥布拉克轻松抓住:

英超门将最快进球_英超门将绝杀_英超门将直接进球

库蒂尼奥的头球,XCG 0.61

按理说,有这样的身体素质和意识做基础,奥布拉克在欧冠赛场上应该会表现得一如既往的稳定。

不过我们前面提到的一个理论在这里就起作用了——奥布拉克的状态也有起伏,可惜的是,当他状态比较差的时候,马竞正在欧冠小组赛中出战;当他状态比较差的时候,马竞已经在欧冠小组赛中被尤文图斯淘汰了。我们来看看奥布拉克联赛限制对手射门得分率的走势:

英超门将最快进球_英超门将绝杀_英超门将直接进球

最糟糕的时期恰好是欧冠小组赛,奥布拉克连续两场比赛被XCG罚下,远射仅0.2次:

英超门将绝杀_英超门将最快进球_英超门将直接进球

这款球的XCG为0.21

英超门将最快进球_英超门将绝杀_英超门将直接进球

此球的 XCG 为 0.19

当然你也可以说,这两个进球,一个是因为奥布拉克的视野被遮挡,一个是因为世界波射得太快了。

但这两个因素目前确实不易量化,尤其是第一个因素,在可预见的范围内甚至都无法量化。这里我们还是要回到那个命题:样本越小,数据越容易失真。对于门将的评价,联赛的参考价值还是应该高于欧冠。

6 皇马迷茫——纳瓦斯确实被高估了,但问题是库尔图瓦更差

无论怎么看,纳瓦斯的数据都完全压倒了库尔图瓦。当然,纳瓦斯本赛季的样本量,无论是联赛还是欧冠,都有些太小了,欧冠赛场,只有三场比赛,参考价值几乎可以忽略不计。但问题是,即便我们只看样本量更大的联赛,即便我们只看上赛季库尔图瓦获得国际足联最佳门将奖,纳瓦斯还是比他强太多了……

17-18赛季纳瓦斯在联赛中限制对手射门数为6.47%,这一成绩并不比特尔施特根的神勇表现差多少。

确实,在防守数据相差无几的情况下,皇马的失球数却比巴萨多了15个,门将确实差了不少,但这并不是纳瓦斯的错,他因为伤病,整个赛季只踢了27场比赛,皇马门将的问题更多集中在卡西利亚斯和卢卡·齐达内踢的11场比赛中。

当然,也不排除纳瓦斯在欧冠赛场上的表现被大大高估,他2.56%的限制对手射门命中率只能说还算不错,距离被称为爹妈的“纳瓦斯”的表现还差得远呢。

不错的数据其实更多的是得到了对阵拜仁的比赛的支持,整体来看,纳瓦斯在欧冠赛场的表现远不如联赛那么稳定:

英超门将绝杀_英超门将最快进球_英超门将直接进球

当然,在杯赛赛制下,过分强调一场比赛表现的重要性也并非完全没有道理英超门将最快进球,毕竟纳瓦斯前后的糟糕表现并没有造成什么不好的后果,那场比赛才真正把皇马从死亡边缘拉了回来。

这里先不说评价标准,最核心的争议是:你顶替纳瓦斯的库尔图瓦,无论怎么看都是最差的那个。

要知道库尔图瓦那个赛季为切尔西踢了8场欧冠比赛,其限制对手射门率高达-10.75%!

就算欧冠的样本量不大,这数据也太离谱了吧?尤其是对阵罗马的两场小组赛,库尔图瓦几乎被对面的阿利森盖过风头,几个丢球甚至让人觉得这人不是反应速度有问题,球速快的时候,怎么会不管对方什么角度射门,都会让球从指尖溜走呢?比如:

英超门将直接进球_英超门将最快进球_英超门将绝杀

这一击非常准确,XCG 为 0.16

英超门将绝杀_英超门将最快进球_英超门将直接进球

再次,射门命中目标,XCG 为 0.12

英超门将最快进球_英超门将直接进球_英超门将绝杀

近脚远距离射门,XCG仅为0.08......

如果库尔图瓦能在联赛中拿出令人信服的表现那就好了,但他在17-18赛季英超联赛中限制对手射门得分率0.72%充其量只能算是平庸,与纳瓦斯相差甚远。

虽然对纳瓦斯的炒作缺乏先进数据的支撑,但从道德角度去批评库尔图瓦也毫无意义。但问题是,如果拿出先进数据来看,库尔图瓦的表现并没有那么好……

结论

上文我们对​​XCG数据做了一些简单的处理,选取了几名门将进行了初步量化,也讨论了这种量化方法的局限性。其他一切也一样,这是一条科学且永无止境的路。数据永远无法真实反映比赛内容,但越是高级,内容就越贴近客观现实。

英超门将最快进球_英超门将绝杀_英超门将直接进球

在大数据的支持下,用于量化守门员扑救的数据不仅仅只有XCG,还有更高级的数据。例如,OPTA的XGot数据甚至考虑了射门时的最后一传,比如角球射门。与运动战传球相比,进球的数学期望值更高。足球当然可以是娱乐、美学,甚至是清醒的情绪宣泄。

但足球也可以是科学。

1384年

(文:魏欣)