科学网—欧洲杯小组赛:从出线结果倒推游戏规则? - 党晓栋的博文
本次欧洲杯小组赛出线规则如下:
小组赛积分相同的球队的排名方式按照以下顺序进行:
a.球队之间的胜负关系(三球队积分相同时则通过这些球队交战的总积分判定)
b.球队之间的净胜球数(在两支以上球队处于同分的情况下)
c.球队之间的总进球数(在两支以上球队处于同分的情况下)
d.小组赛全部比赛的净胜球数
e.小组赛全部比赛的总进球数
f.在欧足联国家排名系统中的积分
g.在预选赛中公平竞赛排名
h.抽签决定
如果两支球队积分,进球数,失球数都相同,并在最后一场小组赛中踢平,如果该小组中再没有另外一支球队与他们积分相同,则两队直接进行点球来决定胜负。
小组赛已经过去两轮,大家根据这些规则来分析各队的出线前景,就已经很头大了。因为有些时候的情况有点复杂。
来点更难的:假设你是个伪球迷,就像我一样,对上面这些规则一无所知。那么等四天之后小组赛的结果全部揭晓之后,你能否从最终的结果来倒推出这些规则?
假设你知道所有这些球队的进球数、输赢关系、红黄牌数、他们的欧足联排名还有在预选赛上的所有成绩。
再多一点条件:你甚至知道赢一场得3分,输一场得0分,平一场得1分。
但是你不知道是不是进球多就有利于出线,你也不知道是不是赢得多就有利于出线。当然这些可以作为你最初的假说,然后用你看到的结果去检验它们。最初的这两个假设还是比较容易检验的。
这样,你能保证把上面那8+1条规则全部倒推出来么?
很明显24场比赛太少了,很可能后面几条规则就没有用到过,那么你是不可能推导出所有规则的。好吧,假设,仅仅是假设,有超过一万场比赛的数据让你用来分析,你能完成这个任务么?
我猜这是一个艰巨的任务。当你不断地在数据中寻找pattern的时候,一会儿你会发现胜负关系似乎决定了每队能否出线,但很快你又否决了这个结论,因为
你发现了很多所谓的“特例”。如此这般,你可能会发现,有时候是净进球数决定了结果,有时候又是总进球数决定了结果。渐渐地你头大了。也许你和很多朋友一
起做这件事情,最后你坚持“抽签决定论”,而你的朋友坚持“红黄牌决定论”,你们开始争论,但谁也无法说服谁。这时另外一个朋友过来说,你们俩都有道理,
但他自己也不确定到底是怎么回事,而你们俩一致认为他在“和稀泥”,是个滑头……
上面这些情况,是否感到有些熟悉?没错,很多学术争论就是这么来的。足球的小组出线规则,不过是8+1条而已,从逻辑上看,一连8个
if...else...,外加一个特例,其实并不是特别复杂。而自然界的规律恐怕比这还要复杂得多。目前基于大规模数据的科研项目到处都是,都进行得热火朝天,然而真要发现一些硬梆梆的规律,那真是难于登天。
我想一个难点在于:这背后的规则多于一条,并且各条规则之间具有一定的逻辑关系,而在“实验”中得到的每一条结果都有可能同时被多条规则所左右。如果研究人员在做数据挖掘的时候,仍然是基于以往的简单逻辑,按照“一条规则一个假说”的惯例来进行推导,那就差不多是瞎子摸象,甚至有时候是缘木求鱼。
有些人于是就说:什么破假说,去他的!我们的现代科学是基于数据的,是“data driven”,那些号称“hypothesis driven”的古典科研方式已经过时了。
我不赞成这种论调。不应该把科研上的失败归罪于“hypothesis
driven”。应该检讨的,是我们提出hypothesis的时候所基于的思路而已。其实在两种“driven”之间,哪有什么明显的界限和优劣之分。如此攻击对方,不过就是终于口水仗而已。还是花时间修整一下思路更为重要。
本人在英文博客上也对此发表了一些闲话。内容与本文80%重合。
转载本文请联系原作者获取授权,同时请注明本文来自党晓栋科学网博客。
链接地址:https://blog.sciencenet.cn/blog-351781-582626.html
上一篇:推荐阅读:关于Human Microbiome
下一篇:High Resolution Melting (HRM) analysis 在谱系地理学中的应用