网易伏羲基于大数据的ADops成功入选VLDB 2023

发布:2023-06-20 14:08:13
阅读:17871
作者:网易伏羲
分享:复制链接

近日,第49届全球数据库领域顶级会议VLDB(International Conference on Very Large Data Bases)公布论文接收结果,网易伏羲以基于大数据的ADOps为主题的论文成功入选。文中提出一种应用于异常检测的流水线框架,简化从日志数据处理到监控上线的全过程,用户能够无需编程,快速创建多个异常监控服务。目前ADOps已应用于网易集团内多款游戏的关键数值行为的监控工作中。

第49届全球数据库领域顶级会议VLDB

VLDB全称是Very Large Data Bases Conferences,与ACM主办的SIGMOD、IEEE主办的ICDE并称为数据库领域的三大顶级会议。入选论文相关成果得益于网易伏羲数源在大数据领域的深耕和积累。伏羲数源专注于为网易游戏、伏羲AI、伏羲机器人和网易瑶台提供全方位的大数据平台和数据服务能力,帮助业务轻松实现数据的全链路生产、管理和应用。

以下是网易伏羲本次入选的论文概述:

《一种用于结构化日志的异常检测流水线》

《ADOps:An Anomaly Detection Pipeline in Structured Logs》

关键词:MLOps、特征存储数据库、大数据引擎

涉及领域:海量数据异常检测

在游戏的开发和运营过程中,会记录多种日志,例如玩家创角、登录登出、物品购买、充值、游戏任务等等。为了保持游戏的公平性和防止外挂等不良行为,网易游戏需要对这些关键数值的行为进行监测和限制。

基于该背景,网易伏羲数源团队通过异常检测流水线来实现推荐、识别、反馈迭代的全链路开发,简单高效的识别不符合预期的行为。其中,结构化日志记录了玩家在游戏中的大量行为,大多数异常可以根据日志序列进行推断,因为它们通常违反了预定的规则。此外,对于非结构化日志的处理,可以基于大模型的文本编码、图像分割等能力来拓宽特征处理的边界,加入到异常检测流水线中。

现有研究大多关注如何提高异常检测准确率,很少有研究关注如何创建一个高效、稳定、通用的异常检测流水线,而在一款游戏或应用中,可能有成千上万的对象需要监控,为每一个监控对象训练模型并部署需要大量的时间与算力,因此关注异常检测效率至关重要。创建通用异常检测流水线主要有3大挑战:

1.监控数量多

日志类型繁多,用户可能需要针对性的单独配置上百种异常监控,每一种任务的配置繁琐。因此,在流水线上,监控任务需要易于创建、扩展和修复。

2.能够适配多种异常检测方法

每个监控项有不同的监控规则。对复杂场景:例如真实货币交易检测,用户行为序列建模对于检测异常值是非常重要的;对简单游戏数值监控:通过SQL语句就可以从日志中定位到异常点,这就要求流水线能够适配大量异常检测算法。

3.实时监控

具有分析数据流的能力以满足实时异常检测需求。

针对这3大挑战,网易伏羲基于MLOps的思想,提出了一种应用于异常检测的流水线框架ADOps,可以简化从日志数据处理到监控上线的全过程,并且用户能够无需编程,快速创建多个异常监控服务。

应用于异常检测的流水线框架ADOps

ADOps主要由3个模块组成:

1.预计算引擎(推荐引擎)

预计算引擎可以向需要帮助的新手用户推荐异常监控阈值,主要应用于简单场景下的游戏数值监控。预计算引擎利用Kylin的预计算能力与单维异常检测算法来实现海量日志的数据处理,为每个监控项个性化推荐监控阈值、秒级返回推荐阈值。

2.特征存储库

特征存储库是一个用于机器学习的数据管理工具,存储日志经过预处理后的数据特征。特征存储库包含离线存储与在线存储。离线存储支持大数据量存储,用于异常检测模型训练;在线存储特征获取计算时延短,用于异常检测模型推理与线上服务。特征存储库支持跨团队、跨领域共享特征值与特征多次复用;保证异常检测模型训练和推理过程中的数据一致性;保证在线场景中特征构建处理低延迟;支持分布式存储与计算。

3.智能检测引擎

智能检测引擎负责管理在线任务,提高模型开发的效率。对数值监控,它可以从预计算引擎接收监控配置,并根据配置项创建实时监控任务,而无需用户编程。复杂异常监控任务可以适配智能检测引擎提供的任务模板完成监控上线。此外,智能检测引擎可以监控异常值的变化,当异常值过多或数值范围有明显变化时会触发警报。智能检测引擎内置shap库,支持从时间和行为维度对异常值进行探索和归因。

ADOps已经在网易雷火内部监控平台上线使用,目前已应用于多款网易游戏近200异常监控任务。预计算引擎中,ADOps依赖于数源提供的离线、实时数据,并通过Spark计算写入分布式特征存储。在智能检测引擎中,ADOps通过数源Flink实时计算和Dask on Yarn来实现分布式任务监控。

关于网易伏羲

网易伏羲成立于2017年,是国内专业从事游戏与泛娱乐AI研究和应用的顶尖机构。网易伏羲已经发表200多篇AI顶会论文,拥有500多项发明专利,以及数字人、智能捏脸、AI创作、AI反外挂、AI推荐匹配、AI竞技机器人等多个领域的领先技术。目前,网易伏羲正在向游戏、文旅、文娱等产业开放AI技术及产品,已服务超200家客户,应用日均调用量超数亿次。

扫码进群
微信群
免费体验AI服务