赛事介绍
自从AlphaGo系列横空出世,AI技术为游戏行业带来了新一轮的创新风暴。基于机器学习的AI Bot成为了游戏AI研究的新宠,展现出广阔的研究价值,AI Bot的竞技性、应变能力、拟人化等也成为学界的热门研究领域。
我们将于今年8月份举办首届《全明星街球派对》人工智能竞赛,诚邀各路AI好手参加,希望通过“为AI提供更加真实的训练环境”来推动AI技术的发展。《全明星街球派对》(https://qmx.163.com/)是网易雷火燧人工作室开发的全新多人在线篮球竞技手游。玩家需要掌握球星们的技巧,并运用策略来赢得比赛。
不同于以往的演示环境,本次竞赛将是世界上第一个基于真实商业游戏环境的体育竞技类游戏AI竞赛。竞赛中,参赛者需要训练并提交能够控制游戏中球员进行3v3篮球比赛的策略模型。竞赛将分为竞技性AI赛道和拟人化AI赛道,前者聚焦于如何利用有限的样本(我们将控制单位时间产生最大上限)训练出在异步决策环境和不同阵容组合下均能较好协作的、并能适配不同对手的智能体,后者则关注于如何利用玩家数据生成行为接近人类玩家的智能体,复刻人类玩家的战术打法。
本次竞赛中,参赛者所提交的模型或程序必须具备控制所有位置类型的能力,包括:中锋(C)、大前锋(PF)、小前锋(SF)、控球后卫(PG)、得分后卫(SG)。竞技性赛道和拟人化赛道的球员名单如下:
这些球员的技能特点,可以在链接https://github.com/FuxiRL/DunkCityDynasty中获取,也可以直接体验游戏。所以,立刻行动起来,去训练你的模型来操控NBA All-Star吧!
竞赛奖励
- 第一名: 35000 RMB
- 第二名: 20000 RMB
- 第三名: 8000 RMB
- 第四名-第十名:2000 RMB
- 第一名:35000 RMB
- 第二名:20000 RMB
- 第三名:8000 RMB
- 第四名-第十名:2000 RMB
- 3000 RMB,由评委会投票选出,授予在技术方案、模型设计上最有创新性的团队
- 3000 RMB,由游戏专家团队投票选出,授予最能体现球员风格特点的团队
- 60000 RMB,授予在拟人化上超越评委会提供的专业模型的团队
- 神秘掉落的惊喜大奖,本次赛事中表现优异的选手在经过组委会考核通过之后,将有机会获得网易伏羲的实习或正式工作offer!
赛程安排
对于竞技性AI赛道
- 该赛道中,所有参赛者提交的模型将进入天梯对战系统进行匹配对战。
- 我们将构建一个在线的ELO评级系统,对参赛者提交的模型进行在线匹配和排位。
- 天梯系统中每一场比赛的双方将采用相同球员阵容,具体阵容将从以下球员中随机选取:约基齐(C)、锡安(PF)、库里(PG)、詹姆斯(SF)、汤普森(SG)。阵容随机规则:中锋(C)和大前锋(PF)中必须随机选择一个,另外两个位置上的球员从剩下三个球员中随机选择。
- 在竞赛提交系统关闭后,我们会再进行14天的天梯测试,之后公布最终名次。
对于拟人化赛道
- 指标评测阶段
- 参赛者提交的模型将与网易伏羲的基线模型进行离线对战。我们将提供一个多维的拟人化评估指标,对参赛者提交的模型进行评估和排名,具体标准细节可以在常见问题板块中查阅。
- 对于参赛者所提交模型,需要测试所有可能的阵容组合下(6种)该模型的拟人指标。参赛者的模型将与基线模型进行200场比赛,在测试中阵容规则将与竞技性赛道一致,即随机镜像阵容。
- 我们会记录下这200场比赛中,该模型的各项拟人化指标,并综合计算出对应的拟人程度数值。拟人化榜单前10名的模型进行众包评测,以决定该赛道的最终结果。
- 众包评测阶段
- 前10名的模型分别进行两两对战,保存相应视频录像供评测比较。每两个模型之间的对战包含6场比赛,每场比赛双方会采用6种可能的阵容组合中的一种,并且双方阵容保持相同。
- 对于每两个模型之间的对战,评审人员将观看对应的6个视频。评审人员将根据视频中双方表现做出哪一方更拟人的判定,判定为更拟人的一方得1分。双方在6次比较中的得分将计入其拟人总得分。每个模型的最终名次将由其拟人总得分决定。
- 参与评审的人数将不少于5人,评审人员将来自于《全明星街球派对》的领域专家。整个众包评审过程耗时将不低于两周,以保证结果准确。
- 两个阶段的测试中使用的球员与竞技性AI赛道所使用的球员一致。
参赛准备
本次竞赛将提供
- 封装网易最新篮球手游《全明星街球派对》的强化学习环境
- 大于300G的历史比赛数据集
- 两个赛道的基线算法(PPO、BC)和对应的模型
- 《全明星街球派对》游戏在线连接服务,提供给参赛者连接进行算法的训练或测试
参赛团队需要达到的目标
- 以高竞技水平为目标,训练出能够同时操控三人队伍进行3v3篮球对战的策略模型。
- 以提升AI Bot行为拟人度为目标,训练出能够同时操控三人队伍进行3v3篮球对战的策略模型。
通用限制
- 基于实用性的考虑,参赛者在每个赛道所提交模型文件大小不能超过5MB。
- 基于实时性的要求,参赛者所提交模型的单次前向时间不能超过50ms。测试中,如果模型在这个时间范围内还未返回动作,将默认返回上一帧的动作。
- 每个参赛队伍在任意一个赛道中,每天可以最多提交2次模型。
- 每个参赛队伍在任意一个赛道中,最多只能保留10个模型。超过这个数量之后,参赛者新提交的模型将会自动顶替目前分数最低的模型。
- 每个参赛队伍可以在本地开启游戏客户端,并连接到我们提供的游戏服务器进行模型训练,最大连接数量限制为100。
赛事声明
- 本次挑战中发布的篮球游戏AI环境和数据集,只允许参赛者在挑战期间和挑战后出于研究目的使用,完全禁止商业用途。
- 组织者将在挑战后开源相关数据,这些数据的使用必须遵守相应的开源许可协议。
- 最终解释权归组织者所有。在特殊情况下,组织者会与相关方面协商并决定最终的解释。