在足球技术的革新上,上海交通大学和阿里巴巴的研究人员迈出了重要的一步。他们的新型人工智能系统——MatchVision——不仅能观看足球比赛,还能识别关键打法,并提供与人类播音员类似的评论。

该技术基于名为“SoccerReplay-1988”的大型数据集开发,该数据集包含从2014年至2024年期间欧洲顶级联赛和欧洲冠军联赛的近2,000场完整比赛,共计超过3,300小时的比赛片段。每个比赛平均有76个评论片段。

QQ20241226-095420.png

该表显示了 MatchVision 如何识别比赛中的关键时刻并为每个场景生成评论。

MatchVision被设计为一个一体化的系统,能够同时处理多项任务,包括跟踪比赛事件和生成自然评论。系统可以识别24种不同类型的比赛事件,如进球、犯规和战术动作。在分析犯规时,它会利用多角度摄像机镜头来判断犯规的类型和严重程度。

测试数据显示,MatchVision在识别比赛事件上的准确率达到了84%,不仅在事件识别上表现出色,在生成评论和判罚犯规方面也优于现有系统。研究团队计划将数据集和模型开源,发布在GitHub上,供更多研究者和开发者使用。

有趣的是,研究发现人工智能和人类解说员关注比赛的侧重点有所不同。AI更注重技术细节和战术,而人类解说员则更关注比赛的情感流动和背景故事。

QQ20241226-095345.png

并排示例比较了人类评论员(GT)和人工智能(我们的)如何描述三个关键比赛时刻——一张有争议的黄牌、一个角球序列和一个进球比赛。

研究人员展示了人工智能和人类对特定场景(如黄牌、角球、进球和守门员扑救)的评论对比,突显了两者在描述比赛关键时刻时的不同方式。

未来,MatchVision的应用可能不仅仅限于比赛解说,还可以自动制作比赛集锦,甚至辅助裁判做出更精确的判罚,基于已有的像越位检测这样的AI技术。

这项研究标志着体育分析和AI应用的一个新纪元,为足球爱好者和专业人员带来了全新的观赛体验。