2025年3月4日下午,由学院、同济大学上海智能科学与技术研究院联合举办的智·信讲堂第73期在嘉定校区智信馆117报告厅开讲。本次讲堂邀请多伦多大学Lacra Pavel教授作题为“On System Theory for Learning in Games”的主题报告。

报告伊始,Lacra Pavel教授首先介绍了系统理论在博弈学习算法分析与设计中的关键作用。她回顾了众多已提出的算法/动态,包括最佳响应策略、(投影)梯度策略、近端动力学策略、虚拟博弈、基于收益的策略或Q学习(强化学习)等。接着,她指出,在某些博弈设置中,为何某些算法有效而其他算法无效,以及如何放宽这些算法的假设并以系统的方式进行推广,是近年来学术界关注的热点话题。
在报告中,Lacra Pavel教授详细阐述了她所在团队在这一领域的贡献。团队的方法基于利用系统理论原理以及与无源性/耗散性的联系,展示了如何将一些流行的博弈论算法视为耗散/无源动态系统与某些博弈映射之间的反馈互连。一旦实现这一点,学习动态的收敛性分析就可以基于标准的无源性理论,通过简洁的论证来完成。
此外,Lacra Pavel教授还讨论了如何利用无源性启发的思想来设计新的算法和学习动态,以解决纳什均衡和广义纳什均衡问题。最后,她进一步介绍了基于无源性的高阶学习动态,并探讨了具有内在动态特性的智能体的学习扩展问题。

报告结束后,Lacra Pavel教授同与会师生进行了亲切的交流和讨论。她还结合自身经历勉励同学们要积极拓宽视野、勇于探索、发现并解决新的科学问题。此次报告不仅拓展了我校师生的学术视野,也增强了大家对系统理论在博弈学习中应用的理解和认识。