网易伏羲RL4RS荣获SIGIR2023 Resource Paper，推动深度学习技术创新

发布：2023-05-10 10:41:57

阅读：27178

作者：网易伏羲

近日，信息检索领域的顶级会议SIGIR 2023公布了论文的接收结果：网易伏羲以RL4RS为主题的论文凭借其技术与创新实力成功选入本届Resource Paper，网易伏羲实验室在深度学习研究中所做的工作获得国际审稿专家的高度评价，审稿专家们认为RL4RS将在强化学习推荐技术在现实场景应用中发挥重要作用。

SIGIR（International ACM SIGIR Conference on Research and Development in Information Retrieval）是信息检索领域的旗舰会议，也是中国计算机学会CCF推荐的A类会议，在国际上享有极高的学术声誉。本届会议共收到822篇长文投稿，仅有165篇长文被录用，录用率约20.1%，被录用的稿件体现出信息检索领域国际最前沿的研究水平。以下为网易伏羲入选论文概要：

RL4RS:一个面向基于强化学习的推荐系统的工业数据集

关键词：基于强化学习的推荐系统、工业数据集

RL4RS:A Real-World Dataset for Reinforcement Learning based Recommender System

RL4RS套件：https://github.com/fuxiAIlab/RL4RS

随着推荐系统的发展，SLATE Recommendation、Bundle Recommendation等场景提出了新的挑战。为了解决这些挑战，最近的研究者采用强化学习来进行推荐，其中推荐过程被形式化为用户（环境）和推荐代理（RL代理）之间的序列交互。强化学习是一个备受业界关注的方向，因为RL范式本质上适合处理多步决策问题，直接优化长期用户满意度，并有效地探索组合空间。但是最近的研究中仍存在两个问题：

第一个问题是缺乏针对基于RL的RS问题的真实世界数据集。主要有两种替代方案，一种是人工数据集，例如RecoGym和RECSIM，但它们不是真实应用中用户的实际反馈。另一种是半模拟数据集，即转换为RL数据格式的传统RS数据集（如MovieLens），其主要缺点是许多强制数据转换不合理。以MovieLens数据集为例：为了满足RL数据格式的要求，Adversarial User Model引入了外部电影信息，并假设用户的选择上下文是一个月内发布的电影，每个显示集的最大大小设置为40。

第二个问题是缺乏无偏评估方法。目前的研究中主要有两种评估指标：传统的推荐指标（召回率、准确度等）和纯强化学习指标（如累积奖励）。然而，前者是短期评估指标，后者高度依赖于仿真环境的准确性。策略评估的偏差也来自“外推误差”，即未见过的状态-动作对被错误地估计为具有不切实际的值。

针对这两大问题，网易伏羲提出了RL4RS。

RL4RS是一个全新的资源，旨在解决基于强化学习的推荐系统领域中的现实差距问题。它包括两个真实世界数据集、数据理解工具、可复现的仿真环境、相关RL前沿算法、Batch RL算法和反事实策略评估算法。我们还尝试提出一个新的系统评估框架，包括环境模拟评估、环境评估、反事实策略评估和来自测试集构建的环境评估。

作为强化学习的推荐系统领域内第一个完全开源的工业数据集，RL4RS有助于更好的推荐算法的研究和更好的模拟环境构建的研究。RL4RS提供了强化学习部署前和部署后的数据集，这非常有助于Batch RL等离线强化学习算法的使用与评估。RL4RS能帮助设计更好的推荐系统，有力支持了游戏经济系统平稳运行，呵护游戏产品生命周期，并结合玩家体验为目标提升了用户满意度，在多款雷火游戏业务中落地应用。

2021年RL4RS曾与IEEE BigData 2021大会合办了网易伏羲第一届大数据竞赛——IEEE BigData Cup 2021:RL-based RecSys，吸引了国内外高校近百支队伍的参赛，并在大会上成功举办了主题WorkShop。网易伏羲RL4RS也将于2023年底在全球首屈一指的大数据技术峰会Ray Summit 2023上宣讲。在IEEE BigData 2021比赛中，网易伏羲RL4RS的解决方案获得了大量的好评，让人期待其即将到来的Ray Summit 2023上的发言，为深度学习的技术发展贡献力量。

关于网易伏羲

网易伏羲成立于2017年，是国内专业从事游戏与泛娱乐AI研究和应用的顶尖机构。网易伏羲已经发表200多篇AI顶会论文，拥有400多项发明专利，以及数字人、智能捏脸、AI创作、AI反外挂、AI推荐匹配、AI竞技机器人等多个领域的领先技术。目前，网易伏羲正在向游戏、文旅、文娱等产业开放AI技术及产品，已服务超200家客户，应用日均调用量超数亿次。

有奖征集第二期｜上传猫狗视频，领取丰厚好礼

还记得去年冬天那场温暖的“爱宠翻译、通情达意”宠物语音征集活动吗？Pettichat、网易严选与网易伏羲三方携手，向千万宠物主发出邀请，用一段真实的宠物叫声，为AI模型注入“听懂”毛孩子的能力，让每一次“喵呜”和“汪汪”都不再是谜语。活动上线后，我们收获了远超预期的热烈回响。来自天南地北的宠物主人，不仅提交了海量高质量的宠物语音，更通过镜头和麦克风，分享了一个个充满温度的生活瞬间。

2026-03-06 18:18:04

网易伏羲获颁“2025音乐产业年度贡献荣誉”

网易伏羲获颁“2025音乐产业年度贡献荣誉”。作为网易旗下人工智能实验室，网易伏羲始终致力于以技术创新丰富文化表达与互动体验，通过AI智能体、多模态大模型等技术，助力构建更沉浸、更具生命力的数字内容生态，这与音乐产业在AI时代追求体验升级、创作革新的方向高度契合。

2026-02-12 16:10:21

网易灵动拍了拍你｜6个一线故事，开启2026工程机械智能化新篇章

当传统施工还在为招工难、用工贵、安全风险高等难题发愁时，一场由人工智能驱动的生产力革命，已经在你我身边悄然落地。从标准化搅拌站到环境复杂的开放港口，从露天矿山到精密的城市改造现场——网易灵动旗下的灵载·装载机器人和灵掘·挖掘机器人，正把新质生产力从蓝图变成现实。 2026年，我们精选了6个来自一线的真实故事，与你分享：工程机械的智能化，如何助力传统行业破解安全生产、人力成本两大难题（以下顺序不分先后）。

2026-02-10 11:04:56

公示｜网易有灵智能体「任务体验官」招募活动获奖名单出炉

各位网易有灵智能体的伙伴们，久等啦～历时1个多月，「任务体验官」有奖招募活动终于迎来最激动人心的时刻——经过有灵智能体PM Agent和观众投票的双重评审，任务设计清晰度排行榜、任务设计有趣度排行榜两大榜单获奖名单最终出炉！活动期间，我们收到了无数充满创意与巧思的任务设计。今天就为大家揭晓，两大排行榜上究竟有哪些“体验官”拔得头筹，赢得了丰厚的奖励！

2026-02-10 10:54:34

有灵体验官投票开启｜由你来决定，哪个“脑洞任务”最有趣？

还记得上个月发布的「任务体验官」招募活动吗？自活动开启以来，这份关于“精准定义任务”的探索，收到了远超预期的热烈反响。我们不仅看到一个个模糊的创意变成结构清晰、逻辑严谨的标准任务文档，还看到了很多AI都想不到的脑洞——有人想当“赛博月老”帮单身人士牵红线，有人要用AI续写“失联老友”的旧时光，还有人想创作“科技与狠活”的搞笑修仙小说……未来工作的起点，或许就藏在这些随口一提的灵感里。现在，活动将进入「评分阶段」：由你们来为这些已经“定义清晰”的任务，投出「趣味度」的关键一票。

2026-02-05 14:51:09

以数据驱动工程机械智能化，网易灵动入选杭州国家语料库首批高质量数据集榜单

日前，2025数据要素发展大会成功举行，汇聚产学研力量，共探数据要素发展新路径。会上，杭州国家语料库首批高质量数据集建设先行先试“揭榜挂帅”名单正式发布，网易灵动凭借“灵掘”工程机械数据集项目成功入选，在推动工程机械智能化领域数据资源共享与技术普惠方面获得了官方认可。

2026-01-30 11:05:40

评审结果公示｜2025年CCF-网易雷火联合基金二期

由网易伏羲与中国计算机学会（CCF）于2025年共同发起的“CCF-网易雷火联合基金二期”在历经80天的指南公开，课题征集，多层遴选等环节，本轮评审终于落下帷幕。二期基金项目围绕 “游戏与人工智能“ 发起多个热门研究方向。面向国内高校及科研院所的全职教师和研究人员，共计开放11个课题，吸引60+高校/研究机构报名。自启动以来，基金项目受到了全国高校学者的高度关注与积极响应。来自（排名不分先后）浙江大学、香港理工大学、北京理工大学、上海交通大学、南京大学、武汉大学、厦门大学、西安交通大学、合肥工业大学等知名高校与院所的专家学者提交了高质量申请，充分体现了学界对该项目的认可与期待。为确保评审过程的专业性与公正性，基金组委会围绕“业务落地潜力”、“研究方向匹配度”、“技术可行性”以及“团队基础”等多个维度，对所有申报项目进行了严格评估与多轮审议。经过专家委员会的综合评议与投票，本轮CCF-网易雷火联合基金11个课题项目全部获得资助。这些项目将在未来一年中获得资金支持与技术协作，推动其研究成果向实际应用场景转化，助力我国人工智能领域的持续创新发展。

2026-01-29 10:12:18

当OPC创业热潮来临，网易伏羲如何以人机协作让“工作更自由”？

伴随平台经济与AI智能体技术的突破性进展，OPC（一人公司）正从理论走向热土，席卷中国一线与新一线城市的创业浪潮。这并非简单的创业形式变化，而是一场由平台经济与AI智能体技术成熟所驱动的“生产力范式革命”：创业的最小单元从团队收缩至个人，而个体对自主、灵活与价值意义的内生追求，更让OPC成为兼具经济理性与自我实现的组织最优解。

2026-01-26 14:24:38

喜报+1！入选浙江省信创解决方案名单，网易灵动以具身智能助力培育经济增长新引擎

近日，浙江省经济和信息化厅公示了《2025年浙江省信息技术应用创新解决方案入围名单及重点推荐案例名单》。该名单汇聚全省百余个信息技术应用创新领域的代表性解决方案，覆盖数字政府、社会治理、产业升级等多个关键领域。在这份高规格名单中，网易灵动凭借自主研发的灵载·装载机器人解决方案成功入围。此次入选，是对网易灵动在推动工程机械智能化、践行信息技术应用创新成果的高度认可。

2026-01-26 14:12:37

苏州见！网易伏羲即将亮相首届CCF OPC大会，探索人机协作下的一人公司新实践

随着人工智能技术加速演进，OPC（全称：One Person Company，一人公司）作为“单人+AI”的新型创业形态，正成为各地培育新质生产力、激发个体创新活力的重要抓手。在此背景下，网易伏羲受邀将出席2026年1月16日（星期五）在苏州举办的首届CCF OPC大会，携自研人机协作平台“网易有灵智能体”与全球专家共探技术如何解放个体创造力，助力一人公司、超级个体等“产消者”（既是生产者也是消费者）实现更自由、有趣的协作。

2026-01-16 14:23:34