当前位置:   article > 正文

2024美赛C题-大满贯被势头打败

2024美赛C题-大满贯被势头打败

C题

完整版论文在此:完整获奖论文

题目大意

在2023年温布尔登网球公开赛男子单打决赛中,20岁的西班牙新星卡洛斯·阿尔卡拉兹击败了36岁的诺瓦克·德约科维奇。这场失利是德约科维奇自2013年以来在温布尔登的首次失利,也终结了这位大满贯赛事中最伟大球员之一的非凡纪录。

这场比赛本身就是一场精彩的较量。德约科维奇似乎注定轻松获胜,他在第一盘以6 - 1(赢得7局中的6局)的成绩占据了主导地位。然而,第二盘异常紧张,最终阿尔卡拉兹在决胜局中以7 - 6获胜。第三盘与第一盘恰恰相反,阿尔卡拉兹轻松以6 - 1取胜。年轻的西班牙选手在第四盘开始时似乎完全控制了比赛,但比赛的走向又一次发生了变化,德约科维奇完全掌控了局面,以6 - 3赢得该盘。第五盘和最后一盘开始时,德约科维奇延续了第四盘的优势,但比赛的方向再次发生了改变,阿尔卡拉兹重新控制了局势,并以6 - 4获得了胜利。

关于这场比赛的数据记录在提供的数据集中,赛事编号为“2023-wimbledon-1701”。你可以通过设置“set_no”列为1来查看德约科维奇占据优势的第一盘的所有得分。在比赛中,一方看似占据优势时出现的难以置信的转变,有时会持续很多分甚至几局,这种现象通常被归因于“势头”。

词典对“势头”的定义之一是“通过运动或一系列事件获得的力量或动力”。在体育中,一支队伍或选手可能会感觉他们在比赛/游戏中拥有势头,或者“力量/动力”,但这种现象很难测量。此外,比赛中的各种事件如何创造或改变势头(如果存在的话)也不是一目了然的。

提供了2023年温布尔登网球公开赛男子比赛前两轮之后的每个得分点的数据。你可以自行决定是否包含其他选手信息或其他数据,但你必须完整记录数据来源。使用这些数据来:

  • 开发一个模型,捕捉比赛中得分发生时的比赛流程,并将其应用到一个或多个比赛中。你的模型应该能够识别在比赛中哪位选手表现更好,以及他们表现得有多好。基于你的模型提供一个可视化图表,展示比赛流程。注意:在网球中,发球方赢得得分/局的概率要高得多。你可能希望以某种方式将这一点纳入你的模型。
  • 一位网球教练对“势头”在比赛中发挥任何作用持怀疑态度。相反,他推测比赛中的转变和一方选手的连续成功是随机的。使用你的模型/指标来评估这一说法。
    教练们非常想知道是否有指标可以帮助判断比赛流程何时即将从偏向一方转变为偏向另一方。
    • 使用为至少一场比赛提供的数据,开发一个模型来预测比赛中的这些转变。哪些因素似乎最相关(如果有的话)?
    • 鉴于过去比赛中“势头”转变的差异,你如何建议一位选手进入一场针对不同对手的新比赛?
  • 在一个或多个其他比赛中测试你开发的模型。你预测比赛中的转变有多准确?如果模型有时表现不佳,你能否识别出可能需要纳入未来模型的因素?你的模型对其他比赛(如女子比赛)、锦标赛、球场表面和其他运动(如乒乓球)的普适性如何?
  • 用不超过25页的报告来展示你的发现,并包括一到两页的备忘录,总结你的结果,并为教练提供关于“势头”作用的建议,以及如何准备选手应对影响网球比赛流程的事件。

提供的文件:

  • Wimbledon_featured_matches.csv – 2023年温布尔登网球公开赛男子单打第二轮之后的数据集。
  • data_dictionary.csv – 数据集的描述。
  • data_examples – 帮助理解提供数据的示例。

术语表

大满贯赛:网球中的大满贯赛是指在一年内在同一项赛事中赢得四个主要锦标赛的成就。这四项大满贯锦标赛分别是澳大利亚网球公开赛、法国网球公开赛、温布尔登网球公开赛和美国网球公开赛,每项赛事持续两周。

关键术语/概念词汇表:

计分:

  • 比赛:最多五盘制(温布尔登网球公开赛男子比赛)
  • 盘:比赛的集合;赢得6局即赢得一盘,但选手必须领先两局,直到比分达到6 - 6时才进行决胜局(见下文)
  • 局:得分的集合;选手达到4分即赢得比赛,但必须领先两分。见下文“计分方式”。

计分方式:

  • 0分 = Love
  • 1分 = 15
  • 2分 = 30
  • 3分 = 40
  • 平分 = All(例如,“30平”)
  • 40 - 40 = Deuce(双方得分相同,至少各赢得3分)
  • 发球方赢得一个平分 = Ad-in(或称为“优势进攻”)
  • 接发球方赢得一个平分 = Ad-out

发球:选手轮流在每局比赛中担任“发球方”(比赛中打出第一球的选手)和“接发球方”。在职业网球中,发球方往往拥有很大优势。每一分比赛中,选手有两次机会将球发到“发球区”内。如果两次尝试都未能将球发进比赛区,则被判定为“双误”,并将这一分判给对方。

  • 破发 – 接发球方赢得比赛。
  • 破发点 – 如果接发球方赢得这一分,他们将赢得比赛。
  • 保发 – 发球方赢得比赛。

决胜局:每盘比赛在一方赢得6局且领先至少两局时结束(例如,6 - 4)。如果不是,比赛将继续进行,直到比分达到6 - 6。此时进行决胜局。在温布尔登,决胜局是先赢得7分(必须领先2分),但在比赛的第五盘中,决胜局是先赢得10分(必须领先2分)。

休息时间/场地两侧:选手在第1局比赛后以及之后每两局比赛后交换场地。从第3局开始,在每次换场时允许90秒休息时间。在决胜局期间,选手每得6分交换一次场地。选手们在每盘比赛结束后也至少休息2分钟。允许进行医疗暂停和一次洗手间休息。

下面是数据集解读的示例,每个示例都以表格形式展示:

示例 1: 行 5

列名描述
match_id“2023-wimbledon-1301”“1301”中的3表示第三轮比赛,“01”表示该轮的第一场比赛。
elapsed_time“0:01:31”这一分从比赛开始的第一个得分后1分31秒开始。
point_no, game_no, set_no4, 1, 1这一分是比赛第一盘第一局的第四分。
p1_sets, p2_sets, p1_games, p2_games0, 0, 0, 0由于这是比赛的第一局,所以双方都还没有赢得任何一局或盘。
p1_score, p2_score15, 30这一分打的时候比分是15(选手1)对30(选手2)。这意味着选手1赢得了之前的一分,选手2赢得了两分。
server1选手1(Alcaraz)在这一分发球。
serve_no1这一分在第一次发球时进行,意味着Alcaraz的第一发球是有效的。
point_victor1Alcaraz赢得这一分(选手1)。
p1_points_won, p2_points_won2, 2选手1(Alcaraz)是这一分的胜者,所以他在比赛中的总得分现在是2(之前是1)。对于选手2,由于输掉了这一分,得分保持在2。
game_victor, set_victor0, 0Alcaraz赢得这一分使得这一局比分变为30 - 30(双方各得2分),所以在这一分上双方都没有赢得一局或一盘(都是0)。
列 U – AC使我们能够确定这一分是如何赢得的:
p1_winner1Alcaraz通过击出一个“无法触及”的球赢得这一分。
p1_ace0这一击不是发球(因为等于0)。
winner_shot_typeF这一击是正手(而不是反手)。
p2_net_pt1选手2(Jarry)在这一分的某个时刻靠近网前。
p2_net_pt_won0由于Alcaraz赢得了这一分,尽管Jarry在这一分中曾在网前,但这个值是0。
列 AH – AM都等于0即使选手2赢得了这一分,这局比赛也不会结束,所以这一分不是“破发点”,这些值都是0。
p1_distance_run, p2_distance_run51.108, 75.631这一分中每位选手跑动的距离(以米为单位)。
rally_count13这一分中双方球员总共击球的次数。
speed_mph, serve_width, serve_depth, return_depth130, BW, CTL, DAlcaraz(发球方)发出了130英里/小时的“身体/边线”发球(我们之前看到这是第一发),并且接近划定球场内外的线。Jarry(接发球方)将球“深”击回(也就是击到了球场的另一端)。

示例 2: 行 8 - 12

行号列名描述
8p1_score, p2_score40, 40比分是40 - 40,意味着每位选手之前各赢得了3分(这也叫做“平分”)。
8point_victor1Alcaraz赢得了第7分(在第8行)。
9p1_score, p2_scoreAD, 40由于Alcaraz赢得了之前的分(第7分),因此第8分的比分现在是Alcaraz的“AD”和Jarry的“40”,意味着Alcaraz多赢了一分,并且可能在下一分赢得这一局。
9point_victor2Jarry(选手2)赢得了第8分(在第9行)。
10p1_score, p2_score40, 40比分回到40 - 40(“平分”),意味着每位选手现在各赢得了4分。
10point_victor1Alcaraz赢得了第9分(在第10行)。
11p1_score, p2_scoreAD, 40Alcaraz再次获得优势,因为他赢得了第9分。
11point_victor1Alcaraz赢得了第10分(在第11行),这意味着他赢得了这一局(现在多得2分)。
12game_no2这现在是第2局的第一分。
12p1_games1Alcaraz赢得了第1局。

示例 3: 行 51

行号列名描述
51p1_score, p2_score40, 30比分是40 - 30,意味着选手1(Alcaraz)领先。
51server2Jarry(选手2)在发球。
51p1_break_pt1如果Alcaraz赢得这一分,他将赢得这一局;因为他不是发球方,所以这是一个“破发点”。
51point_victor1Alcaraz赢得了这一分(因此赢得了这一局)。
51p1_break_pt_won1Alcaraz赢得了这一局,并且他不是这一分的发球方。

总结

背景概述

在2023年温布尔登网球公开赛男子单打决赛中,西班牙新星卡洛斯·阿尔卡拉兹(20岁)战胜了诺瓦克·德约科维奇(36岁)。这场失利是德约科维奇自2013年以来在温布尔登的首次失利,也结束了他作为大满贯赛事中最伟大球员之一的非凡连胜纪录。这场比赛充满了惊心动魄的转折,显示了势头在网球比赛中的重要性

报告具体要求

  1. 开发模型: 使用提供的数据集,开发一个模型来捕捉得分发生时比赛的流程。这个模型应能识别哪位选手在比赛中表现更好,以及他们表现得有多好。同时,提供一个基于模型的可视化图表来展示比赛流程。特别注意发球方在网球中赢得得分的更高概率。
  2. 评估“势头”: 一位网球教练怀疑“势头”在比赛中的作用,认为比赛中的转变和连续成功是随机的。使用你的模型或指标来评估这一说法。
  3. 模型预测: 使用至少一场比赛的数据,开发一个模型来预测比赛中的转变。探索哪些因素最相关,并基于“势头”转变的历史数据,提出针对不同对手的比赛策略。
  4. 模型测试: 在其他比赛中测试你的模型,评估其预测比赛转变的准确性。如果模型表现不佳,尝试识别可能需要纳入未来模型的因素。探讨模型对其他比赛(如女子比赛)、不同锦标赛、球场表面和其他运动(如乒乓球)的普适性。

思路分析

讲解视频:bilibili

最新C题思路1:1-4问思路1

C题思路1代码:1-4问思路1+代码+结果分析

C题思路1论文:1-4问思路1+代码+结果分析+论文

C题思路2:C题思路2+代码

C题思路2论文:思路2代码+论文代码论文整合包

ACE礼包:A、C、E思路2+代码

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/85641
推荐阅读
相关标签
  

闽ICP备14008679号