有灵众包平台助力大模型行业构建高质量数据,完成高效人类对齐

发布:2023-08-25 09:58:06
阅读:23132
作者:网络整理
分享:复制链接

8月23日,网易伏羲用户画像组技术负责人吴润泽博士受邀参加大模型产业主题论坛“沸腾的资本,踏浪的AGI”,在论坛中分享了以《面向大模型落地应用的高效人类对齐》为主题的演讲,向现场众多大模型产业的相关企业介绍了网易伏羲助力打造大模型数据闭环,以低成本构建高质量数据的案例和经验。

在大模型三要素——数据、算力、算法里,加大预训练模型规模及提升数据质量是获得更好的人工智能效果的重要手段。然而,模型越大,效果不一定越好,在大量实际任务存在主观性的情况下,很有可能会产出不可信、有问题的内容。

针对以上情况,吴润泽博士在演讲中表示,网易伏羲作为国内首家游戏人工智能研究机构实验室,能够借助游戏平台的海量数据和仿真环境,致力于推动人工智能技术的发展。网易伏羲依托“超大规模预训练云平台”项目入选浙江省“尖兵项目”后,尝试从数据、算法、系统、应用等多个方面进行技术积累和探索,在面对大模型能力跃升难题时,决定通过人类对齐来进行定向引导,将正面、善意的人类反馈引入大模型,并引入“人群共识”作为反馈信号。

网易伏羲受邀参加大模型产业主题论坛

自今年3月开始,国内AI大模型层出不穷,据《中国人工智能大模型地图研究报告》显示,截至2023年5月底,国内大模型已超过120个,其中10亿参数规模以上的大模型有79个。

如今,数据安全风险日益凸显,在一触即发的“百模”大战下,高质量数据成为大模型不断优化的稀缺资源。“如何以低成本汇集高质量数据”、“如何定义人类对齐交互方式”、“如何确保人群胜任且积极作答”,三大问题成为大模型人类对齐,构建高质量数据的关键。

网易伏羲通过自研的人机协作线上任务平台——有灵众包平台,来解决以上问题。有灵众包平台是目前市面上唯一支持实时人机交互标注方式的众包平台,平台提供了基于用户画像的自动质检功能,在控制成本、缩短任务周期、保证质量等方面融入了一系列的前沿算法,包括主动学习、真值推断、回报分解等,通过数据闭环,不断将人工标注数据反哺AI算法,实现无缝的人机协作任务处理,极大提升了任务完成的效率。

有灵众包平台通过定向引流,吸引高质量人群参与标注任务,以AI算法自动生成带阶梯难度的考试题,培训用户的标注能力,特有的激励设计保证任务越难、能力水平越高的用户得到积分越多,更加公平,以此实现正向循环,做到高效率、低成本、高质量。此外,不同于其他数据标注平台一题一人的标注模式,有灵众包采取群体智能的思路,一个题目多人参与,结合各地人群的知识、智慧,生成更优的预测、决策、洞见和判断。

有灵众包平台

目前,网易伏羲有灵众包平台致力于打造生成式AI高质量数据解决方案,以网易在游戏引擎及AI领域的丰富积累和深度融合,积极协助大模型厂商解决大规模算力数据及预训练模型闭环问题,帮助行业以更低的成本获取更高质量的数据,推动行业健康发展。

扫码进群
微信群
免费体验AI服务