《足球的逻辑》这篇得到了不少有益的批评,以至于我很想写一个修改版,不过更有意思的做法是接着另写一篇。
本文继续分析足球。更重要的是,这回终于可以提供一点数据支持了。
1. 防守与体能
足球比赛的一个一般规律是下半场比上半场容易进球。在以下几个大赛中,上下半场的进球比率分别是:
98年世界杯:上半场39.2%,下半场60.8%
02年世界杯:上半场41%,下半场59%
04年欧洲杯:上半场42.6%,下半场57.4%
06年世界杯:上半场47.5%,下半场52.5%
首先,关于为什么下半场进球多,你可以猜测是到下半场比赛快结束的时候有些比分落后的球队会采取比较冒险的策略。统计表明比赛最后15分钟的进球往往超过其它的15分钟时间段。但问题是“冒险的策略”很难客观判断,而且这样的局面出现的次数也不是特别多。
专家们的共识,是下半场进球多是因为防守队员的体能下降 [Saltin, 1973; Bangsbo, 1994]。另有证据表明 [Abt et al., 2002, Zeederberg et al. (1996), Abt et al. (1998)],当体能下降,射门能力所受的影响要比防守能力所受的影响小。也就是说同样精疲力尽的情况下,进球容易防守难。
发起猛攻的最佳时机是双方体能都下降的时候。这使人联想到解放军特别喜欢在佛晓时分进攻。
但我想提出更重要的一个论点是,各个球队的防守能力正在提高。这表现在从1998到2006年,下半场进球的比重在减小。这极有可能是各队都越来越重视体能的缘故。
下半场进球多,说明防守与体能密切相关。现在的趋势是下半场进球越来越不多,这说明各队的防守能力都基本达到了一个很高的水平。
2. 怎样进球
对04年欧洲杯的统计表明,44.1%的进球来自有组织的进攻,20.3% 的进球来自反击, 35.6% 的进球来自定位球。
对06年世界杯的统计表明,47.1%的进球来自有组织的进攻,20.3% 的进球来自反击, 32.6% 的进球来自定位球。
首先,职业球队应该多练习定位球,统计表明在业余比赛中定位球进球所占的比重远低于此。进球倚重定位球,我认为这再一次说明防守的成功。
再来分析一下有组织的进攻和反击。表面上看,有组织的进攻进球比反击要多不少,但要注意反击的机会是很少的!大部分进攻都是从后场一步步有组织的进攻。进一步的统计[Armatas, Ampatis and Yiannakos, 2005]表明,有组织进攻的成功率是11.1%,而反击的成功率则是16.9%。
反击的好处是对方半场正空虚,可以迅速在对方半场投入跟对方防守人数相当的队员。一个有意思的事情是我以前看报道说中国队有70%的丢球来自被对方打的反击,不知道是怎么算出来的,明显与主流球队的数据不符。
那么进球之前的具体动作是什么呢?04欧洲杯的统计是34.1%的进球来自长传, 29.3%来自短传配合,17.1% 来自个人盘带, 14.6% 来自直接射们(估计是远射和捡漏之类的),另有 4.9% 是乌龙球。
球都是从哪踢进的?04欧洲杯的数据是44.4%是禁区内射门,35.2%在球门区,20.4%在禁区外。而06年世界杯的数据非常不同:58.3%是禁区内射门,37.5%在球门区,4.2%在禁区外。我非常怀疑世界杯的禁区是否比欧洲杯大,或者说德国的球场比葡萄牙的球场大。
我从这些数据得到的教训是多练定位球,防守反击是好机会,快速把球传到前场。需要说明的一点是我在前文说不要盘带,事实上前锋的盘带寻找更好的机会是必不可少的,应该强调的是中后场队员少盘带。
4. 米兰实验室
这些论文中的数据完全不能令人满意。只统计世界杯和欧洲杯是不够的,最好能有各个顶级联赛多年的数据分析。从统计的项目上来看也非常粗糙,比如我很想知道诸如“射门成功率与禁区内双方人数的关系”,“射门成功率与球从后场到前场运行时间的关系”,“球场大小与进球数的关系”这些数据都没有。另外,这些论文写的也没有什么技术含量,完全可以作为本科生的作业项目。
比赛录像都在那里,统计技术也很简单,但是得到数据却需要大量的人力物力。
可是如果你认为这点数据就是目前足球数据分析的世界先进水平,你大错特错了!
分析比赛数据有专门的软件,比如说 Prozone. AC 米兰俱乐部有个专门的实验室, Milan Lab,它使用计算机分析了这支球队队员的上百万数据。其中一个发现是只看一名队员的跳,就能以70%的准确度预测他是否会在比赛中受伤。
米兰实验室的最重要成果可能是发现了“不老的秘密”。2007年欧冠决赛中,AC米兰大多数队员都在31岁以上!凭借这个发现,米兰实验室可以帮助俱乐部延长球员的运动生命,并且合理评估哪些球员值得购买。这个秘密至今没有公布。
如果一个人真掌握炒股的秘密,他不应该写书,而应该用这个秘密去赚钱。看来,米兰实验室真掌握足球数据分析的秘密。
5. 足球的未来
有的人看输赢;有的人看进球;有的人看球星;有的人看精神;有的人看技术;有的人看战术。但不论怎么看,足球并不是一个特别精确的项目,可能远远比不上NBA精确。英国几乎所有球员都来自社会底层,中产阶级根本不踢球,这直接影响英国队的技术。仍然有很多很多教练和球员再凭感觉训练和比赛。有人甚至认为足球就是拼命。但现在有很多人开始看球看数据了。
我认为足球的发展趋势是变成一个更快更精确的运动。除了精确地传球,更要精确地控制体能。看一帮人筋疲力尽地拼抢没意思,一直到最后一分钟都保持高节奏,才是现代足球的完美比赛。
—-
参考文献:
1. Yiannakos, A., Armatas, V., Evaluation of the goal scoring patterns in European Championship in Portugal 2004
2. Armatas, V., Yiannakos, A., Papadopoulou, S., Galazoulas, Ch., Analysis of the set-plays in the 18th football World Cup in Germany
3. Armatas, V., Yiannakos, A., & Sileloglou, P., Relationship between time and goal scoring in soccer games: Analysis of three World Cups
4. Simon Kuper and Stefan Szymanski, Soccernomics: Why England Loses, Why Germany and Brazil Win, and Why the U.S., Japan, Australia, Turkey–and Even Iraq–Are Destined to Become the Kings of the World’s Most Popular Sport
#1 by dofine on 六月 18, 2010 - 3:46 下午
Quote
数据很有说服力哦~
不过对于控制力强的球队,比如巴萨,开场猛攻更好,经常出现的局面是前15min就进球,然后慢慢把比赛控制在自己的节奏里。
#2 by Rossonero on 六月 18, 2010 - 10:39 下午
Quote
还是那句话, 不懂足球, 就老老实实去看球, 别想当然
1. “关于为什么下半场进球多,你可以猜测是到下半场比赛快结束的时候有些比分落后的球队会采取比较冒险的策略。统计表明比赛最后15分钟的进球往往超过其它的15分钟时间段。但问题是“冒险的策略”很难客观判断,而且这样的局面出现的次数也不是特别多。”
客观判断非常简单, 看见教练用进攻队员换下防守队员了, 就是明显的信号. 只是还没有相关数据而已, 但没有数据不等于 “出现的次数不多”. 好歹看过点儿球的球迷就知道这种情况出现的可能性有多大
2. “发起猛攻的最佳时机是双方体能都下降的时候。”
看过球的人都知道, 0:0的时候, 教练如果不满意比分, 一般会换前锋, 但很少会换后卫. 于是大多数上半场打成0:0的比赛, 下半场就会有这样的情况: 经过换人之后, 进攻队员的总体体能要超过防守队员. 这对于为什么下半场进球多是一个更符合直觉的解释. 如果你想论证双方体力同等时, 体力越差越容易有进球, 那就得控制换人的变量, 找那些没有换人或者换上队员不是明显的进攻或防守队员的比赛
3. “进球倚重定位球,我认为这再一次说明防守的成功。”
如果你的 “成功” 定义是只需要体力不需要技术的话, 那我完全看不出这句话的逻辑所在.
4. “我非常怀疑世界杯的禁区是否比欧洲杯大,或者说德国的球场比葡萄牙的球场大。”
禁区的大小是有统一规格的, 任何正规足球场的禁区大小都是一模一样的.
德国的足球场是不是比葡萄牙的大? 呵呵, 你干脆怀疑一下是不是德国的妓女比葡萄牙的骚, 把队员脚头搞软了算了. 何况就算德国的球场更大, 也解释不了为什么禁区外远射进球更少
实际上, 有个很合理的解释: 用球. 06年的球明显要飘, 比如捷克的罗西基打进美国的远射, 弧线很奇怪, 而罗本人并不是以那种弧线的射门见长. 飘的球, 射门队员控制起来会更难. 本届比赛也体现了这一特点. 当然, 这都是得靠看比赛才能明白的道理, 靠拍脑袋是想不到的
4. 关于米兰实验室. 我本人就是米兰球迷. 07年的欧冠, 几乎所有米兰球迷都清楚有多么侥幸. 如果你看看06-07赛季上半程联赛的成绩, 你就不会对所谓实验室有那么多幻想了. 另外过去三个赛季米兰的成绩是什么样也是有目共睹, 尤其是过去两个赛季, 多名核心球员长期受伤, 而且一伤再伤, 受伤频率和时间长度超过正常标准. 至于说 “合理地评估哪些球员值得购买”, 作为米兰球迷, 我真不知道是该笑还是该哭. 如果你了解这些的话, 就不会写出来那些想当然的东西.
5. “英国几乎所有球员都来自社会底层,中产阶级根本不踢球,这直接影响英国队的技术。仍然有很多很多教练和球员再凭感觉训练和比赛。有人甚至认为足球就是拼命。但现在有很多人开始看球看数据了。”
技术是靠数据练出来的? 您真敢说. 巴西几乎所有球员都来自社会底层, 但是巴西人的技术独步天下
#3 by sonic on 六月 18, 2010 - 10:55 下午
Quote
呵呵,博主以后还是多写写物理吧。闻道有先后,术业有专攻,很多东西是要时间积累,才能有足够的常识,更不用说知识了。
#4 by Rossonero on 六月 18, 2010 - 11:04 下午
Quote
另外还有其他许多因素可以说明为什么下半场进球多
比如, 两支不熟悉的球队碰面, 一般开始阶段会小心翼翼, 先稳固防守, 然后观察对方的弱点, 这样双方在上半场用来投入兵力进攻的时间就会比下半场少
还有, 如果一方在上半场比赛中间落后, 一般不会急于大举压上, 而如果到了下半场, 尤其是60分钟后, 就会着急要加强进攻, 于是就形成了一方以阵地进攻为主, 另一方以防守反击为主, 这样当然比比分持平时双方都以阵地进攻为主要更容易进球 (你自己也提到了防反更容易进球)
Pingback: Tweets that mention 足球的统计 « 学而时嘻之 -- Topsy.com
#5 by AA on 六月 19, 2010 - 6:54 下午
Quote
足球是用来踢得,分析有什么用,就像我股票分析的头头是道,但就是亏钱.劝你同人,不要分析这么无聊的东西.
#6 by LAWRENCE on 六月 20, 2010 - 5:00 下午
Quote
我发觉踢足球中柱的机会比进球的还多……
估计假如规定中柱才得分。当每个球员朝着门柱来踢的时候他们又未必能踢中门柱了。
#7 by tianxia on 六月 20, 2010 - 5:41 下午
Quote
支持,做物理的研究足球也是可以的。就是很多人认为足球不是一个可以精准描述的运动,所以认为博主写的不太好。其实我个人认为,像是现代的很多运动都运用了计算机辅助训练,其实采用物理的分析方法去研究足球还是很可行的。或许会是一个新的交叉学科。另外博主的3个课题倒是蛮有意思的。是很适合学生去做。不知道高中生能不能搞定。
#8 by starwu on 六月 21, 2010 - 1:34 下午
Quote
一直很喜欢看你的文章,但是这篇文章实在娱乐成分较大。
#9 by 车东 on 六月 22, 2010 - 8:51 上午
Quote
另外:是不是可以附上这些统计的置信度和置信区间? 感觉因为足球比赛进球少,如果篮球有类似的数据可信度要高得多;
//另外: 后台已经自动升级到WordPress 3.0平台;
#10 by 同人于野 on 六月 24, 2010 - 4:25 下午
Quote
这些统计的进一步数据都在我附在后面的参考文献中可以找到。另外,多谢帮助!
#11 by cow on 六月 22, 2010 - 12:06 下午
Quote
概率本身是表明一个事件发生的可能性的大小,小概率事件不代表不可能发生,就像天气预报一样,是一种不是100%可靠的的东西……
#12 by maishule on 六月 27, 2010 - 10:27 上午
Quote
博主,请问,有按电子云的形式描绘全场足球轨迹的图片么?
#13 by 同人于野 on 六月 27, 2010 - 2:15 下午
Quote
我曾经看过一篇日本人写的研究足球传球轨迹的论文,他们并没有得出任何有意义的结论,只是提供了一个研究方法。
Pingback: 水木计划 – 官方网站
#14 by 左旋肉碱 on 七月 16, 2010 - 4:13 上午
Quote
作为一位球迷,我个人觉得多了解是好事,以后看球能够看出更加多的门道不好吗?
#15 by 纸弃东睐 on 十一月 26, 2010 - 8:25 上午
Quote
大家都批评的挺好的,都显出了正统球迷风范。
但博主的文章还是更好一些,为我们提供了不同的视角。我也是甲级球迷(意思是假球迷,乱起哄之流)。觉得多有些博主这样文章才更有意思!
#16 by 六翼拉菲尔 on 五月 11, 2011 - 6:18 下午
Quote
目前来说同人的其他文章我赞成的部分比较多,但就光看数据来研究足球实在是不靠谱,为什么呢?因为相关条件太多了,而且足球比赛的结果权重我个人认为是技战术水平+球员自身能力+球员状态+少量的外界因素,而同人使用的数据没有考虑到球员的心态和少量的外界因素,所以数据噪音很大,甚至部分数据如果用来参考以后的比赛的话可能毫无意义;
说个很不恰当的比方,像体育类的电子竞技(以前的胜利十一人,现在的FIFA)游戏,在不考虑程序BUG的情况下,可以说量化条件已经非常好了(当然游戏对球员的建模水平和对赛场条件的模拟也是非常重要的因素,但是考虑到双方是同时参加比赛,所以一些因素可以忽略,比如球的轨迹以及队友的跑动等),但是球员的体力比重依然不如技战术水平和意外因素来的大,所以我认为在能够拿到绝大部分相关性的数据之前,对于足球比赛的规律总结还不如从球员和球队本身入手,而不是只考虑体能这样完全的可控因素,而且因素可控了,实际上比赛也就没有乐趣了。
说句题外话,可能来者的朋友很少有人关注电子竞技,韩国的星际联赛职业化程度相当强,但是实际比赛中无论是和对战非韩选手还是国内联赛,第一要看战术,第二要看运气,第三要看发挥,而选手的体能只是决定发挥的其中一个因素,电子竞技尚且如此,何况体育?