RL4RS: 网易伏羲开源强化学习推荐系统工业数据集

发布：2022-09-26 16:50:43

阅读：19532

作者：网易伏羲

分享：

网易伏羲研究团队和伏羲TTG技术团队联合发布的强化学习推荐系统工业数据集RL4RS。

项目背景

基于强化学习的推荐系统（基于RL的RS）旨在通过将顺序推荐投射到多步决策任务中，从一批收集的数据中学习一个好的策略。然而，当前基于 RL 的 RS 基准通常存在较大的现实差距，因为它们涉及人工 RL 数据集或半模拟 RS 数据集，并且训练的策略直接在模拟环境中进行评估。

在现实世界中，并不是所有的推荐问题都适合转化为强化学习问题。与之前的学术RL研究不同，基于RL的RS存在外推误差，并且难以在部署前得到充分验证。

在论文中，我们介绍了 RL4RS（推荐系统的强化学习）基准——一种完全从工业应用中收集的新资源，用于训练和评估 RL 算法，特别关注上述问题。它包含两个数据集、调整后的模拟环境、相关的高级 RL 基线、数据理解工具和反事实策略评估算法。RL4RS 套装可在以下位置找到这个https网址。除了基于RL的推荐系统之外，我们希望该资源能够为强化学习和神经组合优化的研究做出贡献。

比赛主页

https://fuxi-up-research.gitbook.io/fuxi-up-challenges/

论文地址

https://arxiv.org/abs/2110.11073

Github

https://github.com/fuxiAIlab/RL4RS

相关文章

MeInGame虚拟形象智能创建工具

网易伏羲开源的虚拟形象智能创建工具，从单张照片创建长相相似的指定游戏拓扑结构的人物形象。

2022-09-26 16:57:00

Easy and Efficient Transformer（网易超大模型线上推理引擎）

网易开源的针对transformer-based模型的推理加速框架，支持在中低端Ampere架构上单卡高性能推理百亿级模型。

2022-09-26 16:53:54

Opencpop: 全球首个中文精标歌声合成开源数据集

网易伏羲联合上海视觉艺术学院、西工大、同济大学、WeNet社区发布的首个中文精标歌声合成数据集。

2022-09-26 16:49:38

最新文章

人工智能之模型与理论：智能系统构建的科学根基

2026-03-06 18:36:24

人工智能之模型与理论：驱动智能涌现的核心引擎

2026-03-06 18:35:50

装载机无人化：工程机械智能化升级的关键路径

2026-03-06 18:30:55

装载机无人化：工程机械智能革命的锋刃

2026-03-06 18:30:23

连续帧标注：构建时序智能视觉系统的关键数据基础

2026-03-06 18:26:33

热门文章

1网易灵动「灵载·装载机器人」产品介绍2.0

2交通创新引领科技转化赋能——第五届交通科技创新成果推介活动成功举行

3CNCC | 超强阵容！CCF-网易雷火联合基金研讨会嘉宾率先揭晓

4在元宇宙中发现“她力量”，网易瑶台携手TEDx外滩举办元宇宙活动

5网易伏羲：智能体驱动未来可期 | 《天堂硅谷》杂志报道

6报名即将截止！2025年CCF-网易雷火联合基金二期申报进行中

7活动｜Pettichat×网易严选×网易伏羲联合发起：征集宠物语音，邀你读懂宠物心声

8网易伏羲获得Noisylabels榜单高位入选，两项研究引领标签噪声领域

9CCF（中国计算机学会）-网易雷火联合基金评审结果公布！

102025青科会启幕，网易伏羲携游戏AI前沿实践共话未来

产品

网易有灵众包

网易有灵智能体

资料库

伏羲实验室

关于我们

咨询电话

0571-89852163 转 21951

周一至周五 9:00-18:00

邮件咨询

fuxi@service.netease.com

投诉及建议

fuxi-tousu@service.netease.com

友情链接：逆水寒绘梦天工网易雷火

公司简介-客户服务-网易伏羲隐私政策-联系我们-商务合作-加入我们网易公司版权所有 ©1997-2023

在线客服

合作咨询

生态合作

扫码进群

微信群

了解更多资讯