北大李阿明课题组提出复杂系统中智能个体博弈策略更新的有效机制

作者：爱集微 05-23 22:12

来源：北京大学 #北京大学#

7681

群体中智能个体间自组织协作行为是复杂系统呈现高智能特性、高效完成预定任务的基础，也是研发群体机器人协作系统的核心环节。如何设计有效的分布式个体博弈策略更新机制，提升复杂网络化对抗场景中群体协作水平，是充满挑战的科研课题，受到了控制论、人工智能、系统科学、博弈论和网络科学等多学科领域国际学者的广泛关注。

在传统研究中，研究者们往往假定群体系统中智能个体以相同的速率进行策略更新（图1a, b），由此得出同质网络结构相对于异质结构更加促进群体最优策略的演化。然而，这与实际复杂系统中普遍存在的异质网络结构不符，也有悖于多智能体仿真模拟与行为学实验结果。作为设计博弈策略更新机制的关键理论挑战，如何剖析广泛存在的异质网络结构对群体最优策略涌现的定量影响，是长期备受关注的开放性难题。

图1. 不同更新速率下的博弈策略演化/n针对这一问题，工学院李阿明课题组建立了群体系统中智能个体个性化博弈策略更新的有效机制，并给出了该机制下群体最优策略得以涌现的理论条件。该机制允许不同智能体以个性化速率进行策略更新（图1c, d），摆脱了传统研究框架中不同个体更新速率需相同的限制。在个性化策略更新下，他们发现个体策略的最优更新速率与其博弈对象的规模相关；不同于传统同质网络结构，他们还展示了异质网络上群体博弈动力学丰富的演化特性（图2a）。此外，他们详细研究并给出了异质网络较同质网络促进群体最优策略涌现的理论条件，并在基于智能个体真实交互数据所构建的网络结构上进行了分析验证（图2b, c）。进一步，他们还设计了寻找个体最优更新速率的算法，提出了在任意网络上促进群体最优策略涌现的有效方案。该研究为深入理解异质群体结构、策略更新速率以及群体最优策略演化三者耦合下的群体智能涌现机理提供了统一的框架。