Multi-Agent Game Abstraction via Graph Attention Neural Networks

发布:2022-12-05 10:52:49
阅读:2432
作者:刘勇、王维埙、胡裕靖、郝建业、陈兴国、高阳
分享:复制链接

论文介绍

在大规模多智能体系统中,智能体数量多,博弈关系复杂,给策略学习带来很大难度。因此,简化学习过程是一个重要的研究课题。在许多多智能体系统中,智能体之间的交互往往发生在本地,这意味着智能体既不需要与所有其他智能体协调,也不需要一直与其他智能体协调。传统方法试图使用预定义的规则来捕获代理之间的交互关系。然而,由于难以将代理之间的复杂交互转化为规则,这些方法不能直接用于大规模环境。

在本文中,我们通过一个完整的图对代理之间的关系进行建模,并提出了一种基于两阶段注意网络(G2ANet)的新型游戏抽象机制,该机制可以指示两个代理之间是否存在交互以及交互的重要性。我们将这种检测机制集成到基于图神经网络的多代理强化学习中以进行游戏抽象,并提出了两种新颖的学习算法GA-Comm和GA-AC。我们在Traffic Junction和Predator-Prey进行实验。结果表明,与最先进的算法相比,所提出的方法可以简化学习过程,同时获得更好的渐近性能。

论文地址

https://arxiv.org/abs/1911.10715

论文下载

https://arxiv.org/pdf/1911.10715.pdf

最新文章
行动中的认知:预测加工框架下的具身智能——未来展望:迈向自主行动的通用智能
2025-12-29 15:45:13
行动中的认知:预测加工框架下的具身智能——实现路径:主动推断与具身性的融合
2025-12-29 15:44:06
行动中的认知:预测加工框架下的具身智能——理论交融:从“具身心智”到“预测心智”
2025-12-29 15:42:49
权威认可!网易灵动装载机器人入选杭州AI制造业首用优秀方案,已落地全国多个工程项目
2025-12-26 14:55:56
行动中的认知:预测加工框架下的具身智能
2025-12-26 14:45:42
热门文章
1网易有灵AOP平台首届编程挑战赛开启在即!CCF程序员大会赠票福利限时派送中!
2引领数字空间发展,网易瑶台荣登2023新浪VR“巡礼之光”榜首
3赛果公布!网易有灵AOP平台首届编程挑战赛圆满落幕
4直面天命,路在脚下!最全西游记系列捏脸奉上
5CNCC | 超强阵容!CCF-网易雷火联合基金研讨会嘉宾率先揭晓
6网易伏羲获CVPR 2023 UG2+、VizWiz大赛第一名,相关论文入选TIP
7网易副总裁庞大智:激发AI潜力,与全社会共享AI红利|ChinaJoy高峰论坛演讲实录
8网易公司副总裁庞大智:从“被动接单”到“主动修炼” 让以文化为内核的中国游戏产品“叫好也叫座”
9网易瑶台搭建元宇宙虚拟会场 助力长三角一体化数字文明共建研讨会成功举办
10ICLR 2023 | 网易伏羲3篇论文入选,含强化学习、自然语言处理等领域
扫码进群
微信群
了解更多资讯