摘要
现实世界中存在许多复杂系统,如交通网络、社交网络、金融市场等。复杂网络是复杂系统的高度抽象,它以节点和连边表示真实复杂系统内的个体以及个体之间的关联,而演化博弈论则为描述个体行为和个体之间的相互作用提供了强大的理论范式。随着社会经济的发展,合作已成为人们成功实现目标和提高生活质量的必要条件之一。合作可以带来额外的收益,并且有助于群体成员之间建立良好的关系。在复杂网络上进行演化博弈机制研究,对于理解社会博弈中合作行为产生的原因具有重要意义。 传统的演化博弈研究大多数聚焦于利用复杂网络建模,并采取一定的博弈模型来模拟现实情况,解决实际问题,但对促进合作的机制以及群体演化的内在规律研究较为有限。同时,先前研究大多在静态网络模型上进行,而真实网络结构往往具有动态性和不确定性,个体间的关系随时可能发生改变,这会影响到个体的行为和决策,进而影响群体合作率。为了进一步探索促进合作的机制并丰富研究,本文基于NW小世界网络(Newman-Wattssmallworldnetwork),在弱囚徒困境博弈模型和异质性投资的公共物品博弈模型下进行计算机模拟仿真实验,详细讨论了基于动态结构和动态收益的复杂网络演化博弈机制,具体工作和创新点如下: (1)本文提出了一种具有时效周期的动态收益奖惩模型,其中包括奖励因子、惩罚因子和收益影响周期??三个参数。当节点的策略由背叛转向合作时,我们称其为合作趋近者,对其收益进行持续??个演化时间步的奖励;同理,当节点的策略由合作转向背叛时,我们称其为合作远离者,对其收益进行持续??个演化时间步的惩罚。实验结果表明,区别于传统的无奖惩复杂网络演化博弈研究,无论是单独对合作趋近者进行奖励或单独对合作远离者进行惩罚,都可以对合作的涌现起到促进作用;引入收益影响周期??后,奖惩因子对合作的促进作用被放大,两种博弈模型下的群体合作率均与??呈正相关。然后我们在奖励因子和惩罚因子为横纵坐标的参数空间上,进一步探究了群体合作率热区的变化,发现在??取值较小时,奖励因子对群体合作率提升的影响力要大于惩罚因子,而当??增大到一定值时,二者都将拥有对群体合作率提升的高影响力。同时,通过对网络演化过程的分析得知,在囚徒困境博弈中,??的变化对稳态合作率的影响是近似线性的;而在公共物品博弈中??存在突变阈值,能够令合作率发生由低到高的突变。另外,??的增大可以缩短合作率进入稳态的时间,系统将更快地到达收敛状态。 (2)为了模拟现实网络中个体的社交倾向,本文构建了一种具有合作者偏好的动态网络拓扑结构模型,在完成每一轮博弈后,所有节点会以概率??来更新自己的邻居关系,节点在与某个背叛邻居断开连接的同时,与合作邻居的一个随机邻居新增连接。实验结果表明,动态网络拓扑机制能有效地提高不同博弈模型下的群体合作率,且??存在最优作用区间,区间内的??值可以最大化提升合作率,当??超过阈值继续增大则会对合作产生一定的抑制作用。 综上所述,本文通过蒙特卡洛模拟方法进行了多次仿真实验,验证了动态收益奖惩机制和动态网络拓扑机制都能够显著地提升复杂网络演化博弈中的群体合作率,为促进商业竞争、社会治理、环境保护等社会领域问题中合作行为的涌现提供了一定的理论指导。