• 象限分析法:数据不会骗人,C罗
    象限分析法:数据不会骗人,C罗…
  • 阿莱格里:必须小心拉齐奥
    阿莱格里:必须小心拉齐奥…
  • 阿莱格里:C罗也有可能当替补
    阿莱格里:C罗也有可能当替补…
象限分析法:数据不会骗人,C罗的尤文首秀比想象中更好
象限分析法:数据不会骗人,C罗的尤文首秀比想象中更好
发布时间:2018-08-25 07:26  来源:未知  作者:少年足球

尤文引进C罗,无疑是这个夏天最大的热点。

C罗的首秀表现,看过比赛应该都清楚,基本属于“一半是海水,一半是火焰”。就C罗表现而言,可大致分为两个阶段。第一是曼朱基齐替补登场之前,第二是他登场之后。曼朱登场前,C罗长时间的出现在中锋位置。这段时间C罗没有很多触球的机会,即便如此,他同样有过接近破门的射门尝试。同时,在中锋还能承担一定的支点作用。随着曼朱登场,C罗也在左路开启了球王模式,不仅个人闪光的镜头逐渐增加,更为重要的是开始参与团队进攻,甚至送出了很多威胁的传球和单兵爆破。

总体来说,0进球0助攻,触球次数有限,失误少,参与整体战术配合少,放在其他球星,是说的过去的首次亮相。但考虑到C罗不是其他球星,再对比一传一射的贾凯里尼,肯定有部分球迷觉得差强人意,包括C罗自己。

但是,我们针对本场比赛的所有球员,手动统计了22项技术数据,通过建模,使用象限分析法,发现事实的情况非常的出乎意料。

一:一个看起来发挥并不出色的C罗

曼朱替补登场前,C罗基本上是游离于球队进攻体系之外的,没能参与到进攻的团队作战里面。但也有几次表现可圈可点,比如,C罗背身迎球时不停球将皮球后蹭,准确找到后插上的夸德拉多。还有几次小范围和队友的一脚出球配合,很少失误。

导致这种情况出现的问题主要有2。第一,加盟球队的首场比赛,磨合不充分。第二,在磨合不充分的情况下打自己相对不擅长的位置。毕竟是C罗,普通球员在这种境况下,难免会有多次失误,而整场比赛看下来,也很难看见他出现失误镜头。我个人的理解是,阿莱格里之所以如此安排,是因为曼朱基齐无法首发导致。曼朱是个标准中锋,尤文队内无可替代,除了C罗。

将C罗放在中间,至少能够吸引对方中路的重要防守力量,为队友的发挥创造空间,加上他强大的身体素质和技战术能力,能够为球队带来部分中峰的作用。只不过,这样势必会影响C罗的发挥。而当曼朱基齐替补登场,C罗来到左路之后,我们逐渐看到了那个熟悉的C罗,所以有理由相信,阿莱格里这样的选择应该只是特殊情况下的权宜之计。

曼朱登场之后,在左路的C罗,完成了多次和桑德罗的小范围配合,像极了皇马时期他和马塞洛的左边路进攻组合。这些,就是他的角色已经从协助者变成参与者,同时也是开始融入尤文进攻体系的证明。

以上是通过观看比赛的得来的分析结论。只不过,在我们看比赛的时候,其实是无法做到同时可以观察多名球员的发挥,所以这种分析也是不完整的。当我们通过回看比赛,记录球员每一个技术动作,经过数据建模,汇总整理,大家会发现,我们的肉眼,我们感官,对这个世界的认识能力非常有限。就像爱因斯坦的相对论,是一个看不见摸不着的东西,只凭感官,根本无法识别他的对错。这就是我今天所要做的,通过C罗加盟尤文的首场比赛,使用象限分析法,看看33岁的老C罗,加盟尤文的首场比赛,是否配得上他球王的身份。

二、数据显示,C罗依然贡献了球王级的表演

当我们通过象限分析法进行分析之后,意外的发现,C罗首秀的真实情况并非上文所描述的那样。其实我们都被“骗”了。请看象限分析图,C罗本场比赛,依然延续着他过往的风采,打出了球王级的表现。

这是本场比赛数据建模所生成的象限分析图。C罗明显是“一览众山小”。黄色点表示切沃,蓝色点表示尤文。如果只单纯看切沃的象限分析图,不难看出,贾凯里尼就是他们的头号球星,领先队友一大截,且占据着尤文众球星的区域。这么说吧,就本场比赛而言,贾凯里尼具备在欧洲顶级豪门球队效力的实力。

从象限图上显示,C罗的意外性得分(表示创造机会能力)为满分100,技术稳定性得分偏低,是因为触球次数太少了。这里需要说明的是,100分是表明意外性得分最高,而不是事实得分就是100分。基于此,不难想象在出球次数正常的情况,那C罗的坐标就会出现在右上角位置。并且其他球员相应的会出现在更靠近左下角的位置,(算法复杂本文略,有兴趣的朋友可以点击上文链接进行了解),那样C罗就更会显得鹤立鸡群。

当然,象限分析中间会有一定的误差存在。主要集中在两个方面,首先,手动录入数据时个人理解的标准会有所偏差。其次,就是毕竟一场比赛,很多球星会出现发挥时好时坏的情况。所以,象限分析想要得到最接近事实的结果,那必须以一个赛季,甚至多个赛季为周期进行统计。到那个时候,出来的结果,将会和我们感官的理解高度重合。比如说,如果我们统计了近10年C罗的数据进行象限分析,得出的结论应该是一代球王,那这基本符合对他的感官认识。

至于说本场比赛是否具会出现不准确的情况呢?应该是不会的。首先从数据上看,C罗多项数据全场最佳,并且领先第二名很多。有图为证:

由于数据量庞大,现实不完整,我姑且将他以文字表达,图上就不刻意标注了。

意外性次数:C罗13次第一,贾凯里尼7次第二;

小技术次数:C罗5次第一,贾凯里尼和迪巴拉2次第二;

盘带次数:C罗和贾凯里尼6次并列第一,道格拉斯科斯塔5次第二;

威胁射门次数:C罗5次第一,其他几人各1次第二;

射门次数:C罗7次第一,迪巴拉和贝尔纳代斯基各3次第二。


注:统计数据时,不仅记录球员“干了什么”,更注重“干的怎么样”,按照这个规则把足球场上的所有动作首先分成8大类,15小类,并且小类的技术动作又分成terrible(灾难级)、poor(较差)、normal(一般)、nice(漂亮)、threatening(有威胁的)、likegod(神级)六个等级,具体看下图,以“射门”为例:       

为了便于形成公式计算,我们把每项技术动作有对应了不同的分数。某项技术动作的的得分=动作完成次数×对应的分数,换句话说同样一次技术动作,完成越漂亮、越有威胁,就会加入更大的权重。以射门为例,如下图:

若某名球员在比赛中共有10次射门,而这10次射门技术动作的完成情况,按照数据统计记录者的理解来看,terrible(灾难级)1次、poor(较差)2次、normal(一般)4、nice(漂亮)1、threatening(有威胁的)1、likegod(神级)1,那么该球员本场比赛的“射门”这个数据的得分就是9分。

让我们再回到切沃VS尤文图斯正常比赛中来。这场比赛中每名球员的数据得分就是利用上述规则计算出来的。将这些数据简单对比就可以看出,C罗的表现是可圈可点的,只是没法形象的看出他和其他场上球员之间差距有多少。

三、能让前锋和后卫一较高低的数据模型——象限分析

我们甚至可以以一种非常有趣的方式来定位C罗的能力。比如说,同为新援且都是进攻型球员,道格拉斯科斯塔与C罗相比无论从名气、技术实力、经验都无疑强出太多太多,相信这样的结论不会有很大的异义。但是,如果将C罗和新援博努奇进行比较,那争议就来了。比如C罗主要以进球为主,而博努奇主要以阻止进球为主。如果说C罗更强,他踢不了中卫,如果说博努奇更强,他踢不了前锋。再如,近本场比赛,身为中卫的博努奇取得一粒进球,帮助球队扳平了比分,就是说他在一场比赛中同时胜任了防守和进攻的任务,是否可以认为博努奇比C罗还要强。这样的争辩将会无休止的进行下去。

但是,看似不可能进行下去的比较,在本文的象限分析之下,居然能很直观的让C罗和博努奇一较高低!甚至马拉多纳和贝利谁更强这样关公战秦琼的无解课题,只要数据充足,都可以衡量高低。不得不说,这就是数据和象限分析的魅力所在。

足球场上我们能够经常看到,泛泛之辈过人成功率有限;而像小罗,大罗,C罗这样的,当然还有梅西,他们过人成功率极高,为何,因为防守球员根本猜不到他们的下一个动作。这是本次象限分析中所谓的技术意外性,通俗说就是创造力。还有一些过人成功率非常高的,比如贝尔这种,加速度奇快无比,过人就是一个大趟。这是所谓技术合理性,也就是他的基本技能十分强大。这两者结合起来,不可能出现最具创造力和拥有最快速度相结合的球员。但是二者兼而出色的还真的存在。除了大罗,就是我们今天所谈到的C罗。

必须说,厉害的球星,都是二者兼而出色的角色。第一,通过创造力过人成功,如果自身速度不快,很容易被追上;第二,通过速度过人一旦遇见速度和反应不输于自己的对手,连成功过人的可能性都会大大降低。这两者的结局都是无法创造进攻机会。所以,我们的象限分析就是通过球员技术的创造性(技术意外性)和基本功(技术合理性),分成横向和纵向两个坐标轴,进而划分4个象限,来定位C罗的能力。

我们将本场比赛的技术意外性定义为:威胁射门、威胁传球、成功过人、争顶、关键防守等。而在技术合理性方面,我们的定义方法是逆向定义,即:浪费绝对得分机会、传球失误、防守失误、盘带失误、冒顶、失去球权、红点套餐等。简单来讲,就是逆向计算这些便于统计的数据,得出相反的数据,就是合理性值。因为毕竟,合理性的技术动作太多了,还包含很多类似于合理跑位这种难以界定的技术动作。(对于算法详情感兴趣的朋友,请点击进行了解)

算法有了,让我们开始对本场比赛的C罗开始定位。

四:宏观对比:C罗依然高出尤文整体水平一大截

相比较大家接触较多的雷达图,大家可能会觉得雷达图一样能够看出球员之间的差距,就像足球游戏中那样。其实不然。我们在统计本场比赛数据的过程中,发现了雷达图的局限性,比如下图:

雷达图现实两人的图表面积相当,而实际上在象限分析图中,C罗明显高出贾凯里尼不止一个档次。为什么,因为雷达图所能覆盖到的技术数据有限,这就决定着雷达图根本无法反应事实的全貌,它至多能够展示出我们需要对比的技术能力。以本图为例,虽然是通过对22项数据进行计算加工得出8项关键数据,但仅在8项数据之间进行了对比,且没有更缜密的算法作为支撑,依然无法完整的实现对比。象限分析图就不一样,所涉及的技术数据多达22项!不敢说象限分析是最科学的,但相比之下,肯定要比简单的数据分析更有说服力。

象限分析比较适合于在球员之间的对比,虽然它也能看出C罗的水平远高于尤文全队的平均水平。假设尤文阵中出现两名C罗级别的球星,那我们将无法看出C罗与尤文全队的平均水平比较。这一点,雷达图就有了他的优势。请看下图:

就本场比赛而言,C罗的图表面积明显高于尤文整体水平,这与象限分析图中所示吻合,基本实锤。再看尤文和切沃平均实力的对比,同样与象限分析结论吻合。

从上面的象限分析图中还可以看出,本场比赛技术稳定性评分有4人高于80分,尤其是基耶利尼和博努奇,为全队最高。看来尤文的稳定性还是非常不错的。基耶利尼的表现大家有目共睹。博努奇就属于另类,有重大失误的同时取得进球,能有如此数据结论基本属于“功过相抵”型。

说回到那个“关公战秦琼”的话题。C罗与博努奇相比,甚至与和基耶利尼相比,谁更强?这个问题在象限分析的模型里是可以得到解答的。象限分析原本有4各区域,分别代表4个不同水平的球员,按照过往我们做象限分析的经验,C罗和梅西这个级别和博努奇、基耶利尼这个级别的球员会出现在不同的象限里,代表着他们是属于不同层次的球员。但在本次的分析中,由于数据有限,无法做出4个象限的详细分类,并且,C罗本场比赛属于初次磨合,触球次数太少,也没法更完整的展示C罗的技术水平。所以我们不得不在此加上主观的判断,那就是基于C罗处在不利的环境中,得出C罗更强的结论。如果日后有机会,整理整个赛季中意甲前几名球队的所有数据,那就会无限接近真实的情况。

总结:本次象限分析的尝试,我已经在文章中回避了复杂的算法问题。需要说明的是,从数据的录入,包括模型的建设,全部手工完成,没有参考任何数据机构提供的信息,这本身就是一件非常刺激的事情。我们是希望将这个新鲜的尝试推广出去,希望大家给出自己的意见。如蒙不弃,也希望大家支持我们继续做下去。

特别鸣谢:感谢我的懂球帝小伙伴 @Soccercode 先生辛苦的数据录入工作,并提供象限分析的全程技术支持。