Unsupervised representation learning of player behavioral data with Confidence Guided Masking

发布:2022-11-23 11:13:29
阅读:942
作者:浦嘉澍、林建实、毛晓曦、吴润泽、沈旭东、陶建容、尚悦
分享:复制链接

会议介绍

WWW会议又名TheWebConf,全名The ACM Web Conference 2022,由ACM主办,一般每年4月召开,是国际Web领域影响力最大的综合性顶级学术会议,CCF和清华评定委员会都评定为A类会议。

论文介绍

背景介绍可参考:基于多智能体POMDP的无监督表示学习项目

我们的工作充分利用了在游戏中大量存在的无标签行为序列数据,用于训练通用表征,可用于提升游戏内各类智能服务的性能。主要创新点有2个:

1) 巧妙利用了BPE算法用于行为序列的压缩和语义分割。

2) 自适应性Masked Language Modeling预训练任务,重点学习玩家的主动日志,提升表征的质量。

我们的方法主要有以下优势:

1)无需任何游戏相关的专家知识就可以从行为序列中学习玩家的行为表示,有利于新游戏上线后的快速迭代。

2)无需人工介入做特征工程或数据清洗,可直接在raw数据上进行预训练。

3)性能大幅领先于画像特征,并且一个模型可同时服务于多个下游任务,一次预训练,多场景获益。

落地场景及效果

目前无监督预训练表征已经(或正在)在以下场景落地:

1. 魔兽世界的无监督反外挂

2. 倩女的礼包推荐的时机预测

3. 【网易传媒合作项目】应用于网易新闻APP上推荐任务

论文地址

https://dl.acm.org/doi/abs/10.1145/3485447.3512275

扫码进群
微信群
免费体验AI服务