论文介绍
在研究多代理系统中,代理在如何有效地学习并实现协调方面已经付出了大量的努力。然而,由于环境和代理之间复杂的动态关系及动作空间的爆炸性增长,在大规模多代理环境中,这仍然是一个挑战。在本文中,我们设计了一种新的动态多代理课程学习(DyMA-CL),通过从小规模的多代理场景开始学习并逐步增加代理数量来解决大规模问题。
我们提出了三种跨课程迁移机制来加速学习过程。此外,由于状态维度因课程而异,现有的网络结构不能应用于这种传输设置,因为它们的网络输入大小是固定的。所以,我们设计了一种称为动态代理数网络 (DyAN) 的新型网络结构来处理网络输入的动态大小。实验结果表明,与最先进的深度强化学习方法相比,使用DyAN的DyMA-CL极大地提高了大规模多代理体学习的性能。我们还通过广泛的模拟研究了三种跨课程迁移机制的影响。
论文地址
https://ojs.aaai.org/index.php/AAAI/article/view/6221