2025年7月28日14:30,TOPS课题组21级博士生肖琳和20级博士生魏书樵的博士学位论文答辩在通达馆517顺利举行。本次答辩会议由上海电科智能系统股份有限公司沈峰教授级高工、浙江大学朱政研究员、同济大学孙剑教授、同济大学田野教授、同济大学倪颖副教授担任答辩委员会委员,由上海理工大学赵靖教授担任答辩委员会主席,同济大学岳李圣飒副教授担任答辩秘书。肖琳博士的答辩论文题目为《智能网联环境下基于奖励的交通需求管理方案优化》,魏书樵博士的答辩论文题目为《面向自动驾驶测试的机非混合交通流仿真方法与测试环境开发》。
肖琳博士首先介绍了研究背景:智能网联汽车通过车联网技术实现实时信息共享,并可依托云控平台协同优化出行选择。CAVs技术有望重塑现有出行模式,推动交通系统由传统人工驾驶车辆自利行为自发形成的用户均衡状态,向系统最优状态转变,从而有效缓解交通拥堵。现有研究发现在CAVs与HVs共存的智能网联环境中,仅调控CAVs即可推动系统向全局最优状态演进。然而,该调控过程将导致部分个体效用受损难以实现帕累托最优。而设计适应智能网联环境的IBTDM策略仍面临如下挑战:理性行为建模约束多且形式复杂,求解难度大;逐日非理性行为难预测;异质主体行为耦合演化引发奖励方案实施效能波动,增加方案优化复杂性。
汇报时刻
针对以上背景、问题和挑战,肖琳博士鉴于改变出发时间 IBTDM 策略的行为引导潜力及其对智能网联环境的适应性,聚焦于高峰通勤情境下的逐日出发时间选择行为,旨在优化适应智能网联环境的 IBTDM 方案,从而为多行为维度的 IBTDM 策略提供建模方法支持与方案设计参考。首先通过理论建模解析理性 CAVs和 HVs出发时间选择行为,推导理性假设下的时变奖励方案;其次采用长时交互实验和问卷调查方法,采集数据并构建非理性 HVs出发时间选择行为预测模型;最后引入非理性 CAVs的出发时间选择特征,构建集成三类主体的多智能体仿真平台,优化智能网联环境下基于主体类型的奖励策略。论文取得的创新成果如下:
1) 基于理性行为假设,将获取用户的宣传成本纳入预算框架,提出了宜传-激励成本优化分配方法,实现预算在“用户获取”与“行为引导”阶段的统筹配置。
2) 设计了长时追踪与可控实验相结合的非理性 HVs行为观测机制,提升非理性 HVs的参与持续性,增强长时逐日行为数据的时序连续性和可靠性。
3) 提出了基于智能增强的奖励方案仿真优化方法,提升奖励方案效能与系统长时稳定性。
汇报结束后,答辩委员会成员依次就论文格式、汇报内容等方面进行了提问和指导。
接着魏书樵博士进行汇报,他首先介绍了研究背景:城市道路中自动驾驶车辆出现的事故表明,现有自动驾驶车辆对城市道路混合交通流的处理能力尚存在不足,算法有待进一步地开发与测试。在城市道路中,多种异质交通参与者共享道路,形成混合交通流,对自动驾驶算法的规划决策造成干扰。特别是非机动车,由于机动性强且不受车道规则的限制,表现出了复杂的行为特征,大大增加了仿真的难度。而现有数据驱动仿真方法多针对机动车流开发,难以复现混合流中特有的各类干扰行为。因此,为满足高等级自动驾驶算法的仿真测试需求,亟需对机非混合交通流数据驱动仿真方法开展深入研究。而自动驾驶汽车(AV)测试需要面对危险场景的稀有性与高维复杂性,传统测试方法效率低、难以实现有效覆盖,制约了安全性测试的高效开展。
汇报时刻
针对以上背景和问题,魏书樵博士深入探讨数据驱动仿真方法的理论基础,提出了一套适用于城市道路混合交通流自动驾驶测试的仿真方法。针对个体交通行为仿真提出了基于长时域模仿学习的仿真方法,以保证长时仿真的真实性。而针对场景交通行为仿真,对个体交通行为模型进行了多智能体拓展,捕捉多交通参与者的场景行为特征,以复现群体交互行为;针对测试中的可控性需求。在前述仿真模型的基础上,开发了风格可控的行为模型,能够根据测试需求调整交通参与者的行为风格,靶向生成测试场景。最后基于所得模型开发了真实可控的仿真测试环境。论文取得的创新成果如下:
1) 以时段域轨迹数据作为基本的训练单元,提出了学习长时域行为特征的模仿学习框架和学习算法,保证数据驱动仿真的长时仿真真实性。
2) 基于场景为中心模型,提出了多智能体模仿学习和智能体序列寻优算法,适应交通场景中变化的智能体数量和存在时间,保证仿真行为的时空一致性。
3) 从交通参与者风险-效率的偏好选择出发,提出了行为风格提取方法与可控模仿学习框架,实现仿真测试环境中的行为风格精准可控。
汇报结束后,答辩委员会成员依次就论文格式、汇报内容等方面进行了提问和指导。
最后,由答辩委员会宣读答辩决议,经答辩委员会无记名投票表决,一致同意肖琳和魏书樵通过博士论文答辩,建议授予工学博士学位。
答辩合影
TOPS全体成员衷心祝贺肖琳博士与魏书樵博士毕业快乐,前程似锦,未来可期,心之所向,行之所至!