广告
广告

数学家解释了为什么预测算法仍然不会使您成为一个完美的游行疯狂阶段

比赛开始了一周,让我们猜测 - 您的支架被破坏了。

数学家解释了为什么预测算法仍然不会使您成为一个完美的游行疯狂阶段
[源图像:Istock]

又到了每年的这个时候。

广告
广告

March Madness在我们的所有篮球,学校精神,赌博,在线,眼睛上的微小手机屏幕竞技场,隐藏的浏览器 - tab-at-works中都在我们身上, legendary-triumph, devastating-loss, stunning-upset, tears-streaming-down-a-six-foot-tall-college-senior’s-face, crazed-alumni, heart-of-a-champion, Cinderella-story, buzzer-beater glory.

现在,参加比赛的一周,进入甜蜜的十六岁,您的支架被破坏了。

我不是通灵的,只是数据驱动的。我们已经通过了比赛中63场比赛中的48次,而您的括号仍在进行中的可能性非常小。它甚至可能是280,000,000,000中的1分之一。(那是数万亿美元,以节省您的斜视。)

广告
广告

至少,如果您的支架完全是随机的,那将是赔率 - 如果您通过翻转硬币来决定哪个团队赢得每个球队的胜利,则将是赔率。采用该策略,您有50%的机会正确选择;将这个机会乘以48,您的赔率呈指数下降到1/(0.50)^48中的1。整个比赛?您每1/(0.50)^63 = 9.2射击一次千万亿尝试。

Quintillion数量在生活中几乎没有相关,很难理解。根据NCAA网站的报告, if you consider that there are an estimated 7.5 quintillion grains of sand on Earth, that means if you had to guess which one specific grain from any of the world’s beaches I was thinking of, you would have a 23% better chance than a perfect bracket. Or if you had to guess where a single acorn was hidden in any of the planet’s three trillion trees, your chances would still be three million times better than a perfect bracket.

作为戴维森学院(Davidson College德赢提款,您每秒可能会制作十亿个括号,并且还需要300年才能涵盖Quintillion可能的事件版本。

广告

但是再次,千万千毫不相关。实际上,没有人通过翻转硬币来挑选一个括号,如果您根本想确定更好的团队,那么您可能会超过50%,而完美的支架的几率则成倍增长。

它可以达到可能性的领域吗?据查明尔(Chartier)说,多年来研究了“括号学”的人,甚至开发了粉丝友好的“三月数学”网站这会产生加权括号,答案并非如此。有一些建模机可以从数百万个因素中处理数据,以确定每场比赛最可能的结果,但是Chartier表示,尽管进行了数年修补,但其准确性高高约为70%。

如果您有70%的时间选择了每个游戏的正确获胜者,那么您的完美括号赔率将为1/(0.70)^63 = 57亿。仍然是一个艰难的镜头。

广告

这很清楚为什么沃伦·巴菲特(Warren Buffett谁取得了完美的括号:一旦是10亿美元,另一个时间,每年的终身100万美元。作为一个数字人,他知道这永远不会发生。

算法使我们更加接近 - 但没有雪茄

从十亿到十亿美元仍然是数量级。预测算法可以通过分析一系列统计数据来实现这一目标。对于杜克大学和堪萨斯州之间的比赛,它可以考虑杜克大学对阵堪萨斯州的比赛频率,得分差有多大,杜克大学整个赛季赢得了多少场比赛,连续赢得了多少赢得比赛(一场热门连胜),whether star players are injured, the coach’s track record, how often 2 seeds (Duke) defeat 1 seeds (Kansas), and millions of other factors of increasing complexity, down to early-game three-point blocks and late-game free-throw percentages. And each of these factors is adjusted for importance.

这些模型可以实现的壮举在过去几年中已经大大发展,马克·沃德(Mark Ward)是普渡大学的统计学教授,也是以数据科学为中心的数据矿山,告诉德赢提款。They can now trawl information from newspapers, social media, or Wikipedia to glean insights better than humans: “It’s able to discern things that you and I may think are just qualitative—not hard numbers, not quantitative information—but it’s able to garner whether written sentences are favorable for a team because of the way they’ve been trained.”

广告

为了将重点带回家,沃德(Ward去。它通过分析了从过去的匹配中的数据中分析单个移动和决定最有可能的结果,这是通过分析数十亿个可能的结果。AIS可以为运动做到这一点 - 例如EA Games的视频游戏马登为NFL的超级碗做,通过模拟无数可能的游戏,每个玩家都像带有自定义统计数据的国际象棋比赛一样。但是,正如Chartier所指出的那样马登模型对March Madness并不是那么有用,因为它的大多数球员只有一个统计数据,最多只有三场比赛。

沃德最终说:“他们只是模特,”运气和随机性总是可以阻止。

Chartier呼应了这一点,他引用了不可知能力的必然性,这是他尚未弄清楚如何解释的X因素。一方面,情绪压力会造成严重破坏:“较高的种子,当它们遇到麻烦时,就会感觉到历史的阴影落在它们身上,因为您不想成为第二名的种子,失去了15号种子。更不用说15号种子看到了希望和成功的光芒。有时可以提高比赛水平。这很难量化。”有时,团队在比赛中途进行凝胶,并开始表现不同。然后,总是有灰姑娘的故事从左场上飙升 - 这一年,圣彼得的孔雀。去年,罗伯茨金鹰(Roberts Golden Eagles)。Chartier的模型没有预见的。

广告

即使您的选秀权赢得了胜利 - 如果是您的座位,最后一秒钟的蜂鸣器,“您真的预测了吗?”Chartier笑着说:“因为它很容易转变为另一方面。。。。有时人们看着Moneyball并认为可以获得90%的准确性,但是您总是无法预测运气。”(著名的KENPOM排名系统通过“运气”的偏移量尽其所能,计算为团队的实际获胜百分比与您基于统计数据的期望之间的偏差。)

Chartier发现的最重要的是:团队常规赛计划的韧性(“这不仅仅是您的纪录,而是您击败的球队的优势”);所谓的“ Math Mojo”(如果您随着赛季的进展而与优秀的球队获胜);而且不会错过家(如果您在旅途中与优秀的球队赢得胜利)。他说:“如果您在本赛季初在家中参加所有艰苦的球队,那么对三月疯狂表现的预测就不太可预测。”

他承认,NBA更容易预测:尽管球员的技能越来越接近 - 这使得很难打电话,但他们也更加一致。(例如,当球员在大学级别获得“热手”时,变异性比联盟中的极端更加极端。)NBA冠军是一个七场系列赛,而NCAA的单打淘汰。季后赛越长,球队赢得的可能性就越大。

广告

但是最后,这是一个百分比的游戏。他说:“即使您的预测性只有1%至2%,”您的完美括号的机会增加了数十亿美元。

去年,根据NCAA的说法,NCAA每年收集了数百万个参赛作品,因为其官方的括号挑战 - 并没有在28场比赛中保持完美。一支球队被迫没收的令人惊讶的共同游戏。)记录是在2019年创下的当俄亥俄州的神经心理学家连续预测49场比赛时。在3800万到560万亿之间的几率是1。当3种普渡大学在加时赛中击败2种种子的田纳西州时,这场比赛被两场比赛打入了十六场比赛。(在锦标赛中,标题为“ Center Road”的支架简称为“中心路”。)

今年,也许我们只进入了第2轮,但这意味着还有一个半星期的狂野曲折和转弯要走。该死的括号被破坏了,我们在这里为这部戏。带来疯狂!

广告
广告
广告