论文介绍
在多代理系统(MAS)中,每个代理都会做出单独的决策,但它们都会在全局范围内为系统演化做出贡献。在MAS中学习很困难,因为每个代理的动作选择必须在其他共同学习代理在场的情况下进行。此外,随着代理数量的增加,环境的随机性和不确定性呈指数增长。以前的工作将各种多代理协调机制借用到深度学习架构中以促进多代理协调。然而,他们都没有明确考虑代理之间的动作语义,即不同的动作对其他代理有不同的影响。
在本文中,我们提出了一种名为动作语义网络(ASN)的新型网络架构,它明确表示代理之间此类动作的语义。ASN使用基于它们之间的动作语义的神经网络来表征不同动作对其他代理的影响。ASN可以轻松地与现有的深度强化学习(DRL)算法相结合,以提高其性能。星际争霸II微管理和神经MMO的实验结果表明,与几种网络架构相比,ASN显著提高了DRL方法的性能。
论文地址
https://arxiv.org/abs/1907.11461
论文下载
https://arxiv.org/pdf/1907.11461.pdf