千万别得罪Geek 他们说斯蒂芬·库里的三分球记录很快会终结
斯蒂芬·库里(Stephen Curry)最近创造了一个篮球纪录:连续每场比赛投中3分球场次最多者(128场)。“我很难预见这个记录将会怎样终结”,一位教练说,因为大家从未见过库里这样的打球水平;勒布朗·詹姆斯(LeBron James)形容他是“荒唐的”。我们是旧金山湾区的篮球迷,所以我们喜爱斯蒂芬·库里;即使我们去睡觉也知道他会至少投中一个三分球,这种信念让我们心安。但同时我们还是Geek,所以我们不得不看看数字是否支持这种美好幻想。
不幸的是,数字并不这么说。简单论证一下:在这128场连中3分球的纪录中,库里有14场只投中一个三分球。这让纪录看起来非常脆弱:一个三分球离没有三分球可是很近的。为了论证再严谨一些,我们用泊松和负二项式建立了两个数学模型,来预测库里比赛没投中三分球的概率。
[注释:我们把库利128场连中三分球的数据导入模型——注意这个数据量足够大了,因为我们还删选了他没投中三分球的比赛数据。两个模型都能与数据相符合。所有的数据都来自库里在2016年2月25日前打的比赛。自从我们开始测算分析,库里又打了几场比赛,包括输给洛杉矶湖人队那场,那次他只投中一个三分球。]
这些模型一般用来预测在某一时间段中事件发生的某个次数出现的机率——比如,加利福尼亚明年发生2场大地震的机率。有了库里通常投中三分球的概率,我们可以用模型来预测他在一场比赛中投中三分球数为0的机率。其中一个模型预测库里每69场比赛会有一场投不中三分球,另一个预测每42场比赛出现一次。如果我们只用这一赛季的数据来看(既然库里球技有所提升),数字会好一些:一个模型预测他每151场比赛会有一场投不中三分球,另一个预测是每103场比赛出现一次。但是无论以哪种方式分析,这些模型都没有说这个纪录会永远保持下去。
但是想开一些:当数字告诉我们一些不想看到的东西时,我们要尝试找到事情不对的原因在哪。首先,库里可能会进步神速,用历史数据不能预测他将来的表现。(另一方面,他也有可能意外受伤退出比赛,或者影响到他投射能力。)第二,库里可能会在还没投中三分球的比赛中想方设法投中一个,以此来取悦他的粉丝或者鼓舞他的队友们。我们的模型假设他没有这么做。
我们无法找到证据支持第二种可能。我们看每场比赛的完整记录时,没有发现类似于库里连续投球直到投中三分球为止这种迹象。
这让我们思考一个更广泛的问题:其他NBA球星是否刻意设计打法来完成引人注目的个人数据(比如连续的纪录),而不是帮助他们的球队呢?个别球员已经遭到如此控诉,但是用数学来证明并不容易:举个例子,一个球员拿下很多分可能是为了球队最大利益,而不仅仅是让自己看起来很棒。
我们找到确切证据说明,其他NBA球员有时会为了梦寐以求的篮球成就:三双,选择优先提升自己的数据而不是贡献球队。拿到三双必须在三种不同数据中达到两位数:比如至少10个得分,10个助攻,10个篮板。球员有时会做出疯狂举动——伤害到自己球队的行为——以拿到三双。这里有一个著名时刻,里基·戴维斯(Ricky Davis,白色球服)为了得到最后一个篮板来刷三双,故意投向自己球队的篮筐。(另一名球员暴怒推了他一把。)
很少有球员做的那么明显——但是数据允许我们发现一些微妙的信号。当我们观察那些拿了很多三双的球员时,我们明显发现他们是有意努力做到的。我们检查了他们至少拿到10得分10助攻的比赛,看他们会得到多少篮板。如果球员有意刷三双,我们会看到他们恰好拿到10篮板的比赛数异于寻常,这就是我们能看到的(左图)。影响实际上十分显著:球员恰好拿到10个篮板的比赛数比我们预期的要多1/3。当我们以助攻数来看时,出现了同样的模式(右图)。如果球员心无旁骛地帮球队打比赛,我们可能不会看到扣球数刚好是10:他们在故意改变打法来拿到三双。
所以说没有人喜欢Geek:数学摧毁美好梦想。斯蒂芬·库里的纪录早晚会终结,并且其他NBA球星都在打造他们的数据。而我们想知道自己为什么中学一直没(女)朋友。
(翻译:李雪)