【翻译团】阐释xG及其他冷门术语:如何通过数据分析更好地理解比赛
随着时间的推移,未来20多岁年轻人看球时所用的数据将与现在大不相同,过去,足球的讨论大多依赖于射门、犯规、角球等传统统计数据,但在今天,已经越来越多的球迷和分析师开始关注xG、xA、PSxG、PPDA和Field Tilt等新兴数据。
本文将通过三个问题,帮助你更好地理解xG,并介绍其他一些相对冷门但十分重要的足球数据,帮助你更深层次地了解现代足球的数字化分析。
在讨论某个具体射门场景时,xG其实是衡量机会质量的指标。最简单的例子就是点球。点球的xG 值是0.78,因为历史数据显示78%的点球会进。 而在禁区弧顶的一脚射门,xG可能是0.04,因为只有4%的这类射门能进球。
而放到整场比赛来说,每次射门的xG值累加起来,可以用来评估球队或球员在比赛中创造的总体进球机会。例如,如果一个球队在比赛中累积了2.5的xG值,这意味着他们预期能够打入2.5球。
其实,xG最有用的地方是用来衡量一支球队在较长时间内的表现。如果你查看一支球队多场比赛的xG与实际进球差值,就可以准确分析球队状态好坏的阶段分布。而如果是在一场比赛的场景中,xG的表现还算可以,但对单次射门的衡量,xG的参考价值只能说凑合。
切尔西不同时期的非点球预期进球和非点球预期失球值
xG模型的背后的数据量非常庞大,Opta作为最常用的模型,它的数据来自10或11个主流联赛(并非全球平均值),数据库里大约有超过50万次射门记录。因此,xG模型考虑的是几乎所有球员在相似类型下的进球概率,因此预期进球与球员的能力没有关系,无论是中后卫还是顶级射门来射门,在相似情况下的预期进球的数值是一样的。
如果利物浦和南安普顿进行比赛,双方的xG如果都是2.10,但实际完全不一样,因为利物浦的球员很可能会进更多的球,因为他们的球员更优秀。这也是“预期进球”这个名字不太贴切的地方,这个名词从冰球那里借鉴而来,但它让人觉得是在预测未来会发生的事情。但叫做‘可能进球’确实会更合适。
这也就是为什么梅西几乎每个赛季的进球数都超出了他的xG。热刺的孙兴慜和拜仁的凯恩也是,因为这些球员总是表现超出“预期”。
这对数据分析者来说是的确一个小众例子。Opta 有一个叫做‘绝佳机会’(Big Chance)的数据指标,而加斯科因的那个例子就是典型的‘绝佳机会’,并且,它也会得到一个xG值。
这样的情况很少见。一个更好的例子可能是最近的普斯卡什奖进球,加纳乔在古迪逊公园的那记倒钩射门。那次射门他在禁区里的位置很好,因此 xG 高达6%左右,但他实际做的却是背对球门的倒挂金钩,而那个难度极高,xG并没有考虑到这些。
所以,尽管 xG 模型考虑的因素涵盖甚广,包括射门的地点、方式(如头球或脚射)、距离球门的远近、射门前是否有防守队员干扰等等,但仍然会有遗漏的细节。这就是为什么单独计算每次射门的 xG 并不完美。xG 的真正价值在于观察一支球队在整个赛季或多个赛季中的表现。
在低级别联赛球队中,有些球员在比赛中非常突出,但他们的进球、助攻数据可能没有很好地反映他们的水平,因为他们的队友表现糟糕。比如说边锋在一场比赛中20次把球准确传到了禁区,但由于前锋跑位不准,皮球每次都越过前锋的头顶。那么,这就是我们要引入预期助攻(xA)的地方。
一次精妙的传球,尽管它没有直接助攻队友得分,但它通过让对方防守队员移动,可能为进攻创造了一个很好的机会,亦或者只是为队友创造了一些空间。如果我们考虑全盘,将所有的进攻要素连贯起来,而不是只将比赛中的每一个动作(传球、传中、头球等)看作一个独立事件,继而为每一次传球赋予一个值,这就是xA背后的逻辑。
xA可以很好地评估罗德里这种球员对比赛的贡献
xG衡量的是射门一瞬间可能取得进球的概率,而PsxG是指射门之后可能取得进球的概率。也就是说,只要起脚射门,xG就不会为零,而PsxG则只有在射正的情况下才不会为零,而射向球门上角或下角,进球的概率会比射向中间要高很多。
PSxG 不仅考虑了xG所考量的所有因素,而且考虑了射门的完成质量,因此,PSxG和xG之间的差值可以用来描述射手的射门完成质量,我们以北马其顿绝杀意大利的那粒进球为例,这次远距离射门机会的xG仅有0.04,而特拉伊科夫斯基用精湛的脚法将皮球直送球门左下死角,让PSxG达到了 0.45。
不过 PSxG最常用的场景其实是衡量守门员的扑救能力,我们也可以把 PSxG叫做xGOT,还以特拉伊科夫斯基射门为例,xGOT为0.45,即意味着留给多纳鲁马的扑救成功率为0.55。长期来看,一名门将实际丢球(GA)与xGOT的差值,就可以用来评价这名门将的水平和状态。
随着高位逼抢在足球中越来越普遍,人们开始尝试量化逼抢。Passes per defensive action,这个指标是衡量一支球队逼抢效率最直观也最具有代表性的数据。如果某队的PPDA是10,意味着对手在你进行1次防守动作的情况下,会传球10次。
这里所谓的防守动作,包括铲球、拦截、空中对抗、和任何针对进攻球员的防守互动。需要补充的是,这项数据的计算有着明确的范围界限,那就是60%的高位区域。即对方半场的全部,加上自己半场的五分之一。所以PPDA实际就是对方在本方60%高位区域传球次数/本队在本方60%高位区域的防守次数。
PPDA的适用范围是60%的高位区域
PPDA值高表示一支球队比其他球队更多地回收防守;他们很少试图在对方半场或中线附近压制持球球员。失去球权后,球员们不会进行高位逼抢,而是会进入中路或低位防守。反之,PPDA值越低,表示球队的逼抢强度越高,这从公式上看很容易理解(对方传球次数/本队防守次数)。
Field Tilt是对控球数据的一个略微改进版,它是指一支球队在进攻三区的触球比例。比如,如果A队在进攻三区总共进行了80次传球,而B队在进攻三区只尝试了20次传球,那么A队的场上进攻三区控球率就是80%。
进攻三区就是指球场三等分里的前场区域
比起简单地对比双方控球率,进攻三区控球率对双方在比赛中的主导地位提供了一个更清晰的画面,简单地控制球权并不总是能说明一支球队在比赛中的优势,而如果一支球队的赛季进攻三区控球率达到70%,你就会知道他们在进攻端真的是很强。
足球已经存在了 100 多年,每个人都能理解射门、扑救、助攻、铲球、逼抢这些术语,但如果你回头看看1987年约翰-巴恩斯在利物浦主场首秀的报道,上面写着他进一球造一球,而现在,我们会说他打进一球并助攻一次,但那个时候‘助攻’这个术语还没有,那是1990年代从美国体育中引入的术语。
今天,如果一个球员错失单刀,人们会说“他应该打进那个球”,而本质上,这就是xG。
Tim Spiers/2024-12-30
https://www.nytimes.com/athletic/6021663/2024/12/30/xg-ppda-explained-expected-goals/
虎扑足球翻译团是一个聊球、八卦、学外语的有趣团体,只要对语言有一颗热爱的心,虎扑翻译团就欢迎你的加入
https://bbs.hupu.com/35323629.html
Tudent
不过XG毕竟是一个平均数据,所以不能说XG预期低的进球就是不合理球