5月27日上午10:00-11:30,院级高等讲堂于36365线路检测中心no1(通达馆)102会议室成功举行。本次讲座的主题为:基于相关均衡的实时路径诱导:一个双向深度强化学习框架。讲座邀请了来自美国伦斯勒理工学院的贺晓征副教授为大家带来了精彩的报告。
贺晓征是美国伦斯勒理工学院土木与环境工程系副教授,兼任由沃尔沃研究与教育基金会资助的可持续城市货运系统卓越研究中心助理主任,负责可持续交通研究。首先,贺副教授向我们介绍了他主要的研究领域,他的主要研究方向包括交通系统建模、分析和计算机模拟,涵盖交通管理建模与算法设计、基础设施韧性分析、新能源车辆发展规划以及车联网建模、分析和车流控。
接着,贺副教授以他带领的团队研究为例,生动讲述了研究网联自动驾驶车辆环境条件下的双向深度强化学习模型构建框架。主要涉及两个主体,即网联自动驾驶车辆以及实时路径诱导信息提供者,针对不同主体有不同优化目标。从不同角度主体出发构建不同方面的决策变量。其中单个智能网联汽车可以实时学习最佳路径以缩短行程时间,而信息提供者利用系统侦测数据来学习最优路径诱导策略,以达到减少交通拥堵。这种方法有助于缓解在传统路径诱导中个体层面和系统层面目标之间的冲突。该研究框架建立在相关均衡(一类更宽泛的纳什均衡)概念基础上。
最后,理论分析和仿真表明,在该框架是可以实现相关均衡的,既能一定程度上确保减少拥堵,又能保障个体用户的主观感知最优。该研究强调了信息共享在促进智能网联汽车之间合作方面的潜力,有助于提高交通路网效率,为实现智能交通系统中的各类系统目标铺平道路。同学们针对研究内容提出相关问题,贺副教授也详细解答了现场现场相关问题。