AI丢人大发了:把裁判光头当足球 追了一整场

AI在体育界有多不靠谱?

上个月,在苏格兰足球冠军联赛的赛场上,AI摄像机将裁判员的光头识别成了足球,疯狂追了一整场。

AI丢人大发了:裁判光头当足球 追了一整场

无论哪支球队进攻,哪个球员带球,AI都视而不见,反而紧盯着边裁的光头不放,还时不时给个镜头特写。

全场90分钟的足球盛宴,在家看直播的球迷们大部分时间都在围观一颗头。

AI丢人大发了:裁判光头当足球 追了一整场

“真想冲上去给教练扣一顶帽子!”不少球迷吐槽称。

由于直播画面一度非常糟糕,事后,赛事负责人还亲自发文向球迷们致歉。

这是苏格兰因弗内斯足球足球俱乐部首次在直播赛事中引入AI摄像机,原本是为了给球迷们提供更好的观赛体验,因为由于新冠疫情的大流行,广大球迷们不能到现场去观看比赛。

但没想到,AI竟然翻车了,还翻得如此彻底。

AI丢人大发了:裁判光头当足球 追了一整场

这件事情发生后,赛事举办方在采用AI技术方面不得不变得更加慎重,因为多次翻车事件已经让球迷们极度不满。

最近,来自慕尼黑工业大学的研究人员也证实了这一点。他们利用机器学习分析了球迷们对AI技术的态度,结果发现:在124场英超联赛中,球迷们的差评率高达41.1%,好评率仅为25.5%。

不过,这里的AI技术指的并不是AI摄影师,而是另一项应用—VAR。

视频辅助裁判VAR

最近,曾获得2次英超联赛冠军的足球运动员詹姆斯·米尔纳(James Milner)在Twitter上吐槽。

AI丢人大发了:裁判光头当足球 追了一整场

很明显,我们需要严肃讨论VAR的价值。不止我一个觉得当前的AI不适合大型足球赛事。

Milner提到的VAR,全称Video Assistant Referees,是一项AI视频辅助裁判技术。

采用VAR技术的目的是:通过视频分析辅助主裁判,减少比赛中可能出现的争议和误判情况。

不同于主裁判必须亲临现场,VAR通过摄像机捕捉到的比赛画面进行视频分析来做出判断,因此它更可能关注到一些微小的细节,因为比赛场面瞬息万变,仅凭主裁判肉眼观察难免出现争议。

当然,只有主裁的判罚出现争议时,VAR才会派上用场。比如出现球员犯规或是越位、红牌判罚、犯规地点是否在禁区内、禁区内手球和犯规等情况时。

AI丢人大发了:裁判光头当足球 追了一整场

VAR技术开始走向足坛是在2016年,当时它首次在美国职业大联盟的一场预备队杯赛中担任裁判助手,之后,经过两年的技术升级,2018年国际足球协会理事会(IFAB)正式推出VAR,随后它便开始被大量用于各国联赛、杯赛中。

从近几年的反馈来看,VAR的表现让球员们非常不满。

2018年,在世俱杯一场半决赛后,齐达内、贝尔、莫德里奇、卡塞米罗等大牌球星纷纷吐槽:“VAR把比赛搞得支离破碎。”

AI丢人大发了:裁判光头当足球 追了一整场

而在此次之前,布冯也曾公开表示:

“我知道这项技术是实验性阶段。但当这个简单的工具,让比赛频繁陷于中断,我感觉很糟糕,感觉像是在打水球一样。”

近日,2020年英超联赛正如火如荼地进行,Milner也借此表达了他对VAR的看法。

不过,VAR在比赛中的综合表现如何,是否能够继续使用,仅有球员们的反馈还是不够的, 观众和粉丝们的态度也非常重要。另外,从科学的角度来讲,评估一项技术辅助工具需要进行科学的研究分析。

鉴于此,慕尼黑工业大学的研究人员利用机器学习技术对他们的态度进行了科学分析。

被嫌弃的VAR

在体育赛事期间,有79%的观众会通过社交媒体进行互动。

其中最为普遍的是在Twitter上发文。这对于AI来讲,是一个庞大且有效的检测数据集,而且球迷们发表的推文是情绪检测的重要指标。

因此,研究人员从2019-2020英超联赛129场比赛中,使用官方Twitter API收集了643251条推文作为研究数据集,其中4583条推文作为训练数据集。

AI丢人大发了:裁判光头当足球 追了一整场

另外,他们将观众情感划分为三类积极(肯定)、中立(无感)以及消极(吐槽),并训练了一个情感分类模型。

多种监督的机器学习算法均适用于训练短文本语料库的情感分类模型,在这里,研究人员使用了梯度增强方法来训练基于树的模型,因为这种方法在此类问题的研究中展现出了最佳性能。

此外,他们还采用了三个进一步的分类模型:一个是朴素贝叶斯分类器(Bayes Classifier),一个支持向量机(Support Vector Machine),另一个是基于Bagging的随机森林(Random Forest)。

如图,研究人员对所有模型进行了标准的10倍交叉验证。测试结果显示了在情感分类和主题检测(是否与AVR相关)这两个分类问题的10次交叉验证的性能度量。

AI丢人大发了:裁判光头当足球 追了一整场

在主题检测方面,基于决策树的三种方法的准确度都达到了94%,而且在F值上也没有太大差异;支持向量机的表现稍差,朴素贝叶斯分类器的精度值仅为71.0%

在情感分析中,模型达到了最高的准确性值(70.8%),可以说,该方法比传统增强方法和情感分类/主题检测(VAR)模型的性能都要稍好。

来看一下该模型最终的分析结果:

AI丢人大发了:裁判光头当足球 追了一整场

在4,583条推文中,有31.1%被标记为与视频助理裁判(VAR)相关。在情感方面,有25.5%的人表示为积极情绪,而有41.1%的人表示为负面情绪,其余为中立情绪。

另外,研究人员为了比较了94次VAR事件前后不同时间间隔的平均情绪。结果发现一旦发现VAR事件,平均情绪就会显着下降。

AI丢人大发了:裁判光头当足球 追了一整场

这表明,采用VAR技术的赛事或与VAR相关的事件都会给观众带来明显的不满情绪。

那么如何减少观众们的消极评估,除了进一步提升技术减少乌龙事件外,研究人员在此也给提出了两条建议:

足球协会在VAR的使用过程中应尽可能确保透明度,即在球场上同步公布AI评审过程的信息。

足球管理机构需要改进现行体制,实施质询制度,让比赛各方可以通过对现场投诉来启动审查程序。

AI赋能体育的可能性

可见,基于视觉技术的AI,在赛事直播和辅助裁判方面还远不够成熟。

不过从现实考量来看,AI想要做好这件事确实不容易。因为包括足球赛在内的任何大型体育赛事,不仅现场瞬息万变,涉及运动员众多,而且场地也足够大,这些外在因素对AI、对硬件、对算法都提出了非常高的要求。

另外,它还要求系统必须有一个强大的后台大脑,能够能实时地分析若干数据,在最短的时间内提供最为科学的现场报告,这一点在辅助裁判方面体现的尤为明显。

虽然目前的AI技术存在明显的局限性,但这并不妨碍它在赋能体育市场的可能性。

最近几年,AI加速渗透到体育领域,在多次翻车事件之后,其实我们可以看到AI技术的不断升级、优化,看到它在更多潜在应用场景的价值,比如用AI分析球队打法、预防球员受伤、评价球员积极性等等。

总之,热血澎湃的体育赛场需要AI,只是一切需要慢慢来!