2026年5月25日8:30,TOPS课题组20级博士生邱树涵和22级博士生范镓麟的博士学位论文答辩在通达馆600顺利举行。本次答辩会议由浙江大学金盛教授、同济大学邵敏华教授、同济大学孙剑教授、同济大学倪颖副教授、同济大学孙杰副教授担任答辩委员会委员,由东南大学任刚教授担任答辩委员会主席,同济大学孙海浩讲师担任答辩秘书。邱树涵博士的答辩论文题目为《稀疏观测条件下路网个体车辆出行路径重构方法研究》,范镓麟博士的答辩论文题目为《面向自动驾驶算法训练的交通仿真方法研究及应用》。
邱树涵博士首先介绍了研究背景:车辆路径是理解路网交通运行过程的基本单元,路径级感知有望提升交通系统的精细化管控能力。在成本和可持续性约束下,FCD+AVI 是长期可依赖的路径观测数据源,但社会车辆出行路径观测高度间断、稀疏且含噪。围绕个体车辆出行路径重构这一核心任务,论文面向“完整、全量、个体”路径感知目标,聚焦稀疏观测条件下路径选择影响因素多、观测物理约束强、重构结果高随机等挑战,探索如何在现有稀疏观测条件基础上提升重构效果。

汇报时刻
针对以上背景和问题,邱树涵博士构建了路径选择与重构的一致推断基本架构,并按照“序列信息利用增强下的车辆出行路径重构——面向模型稳健推断的车辆出行路径重构——不确定性视角下路径可重构性度量”的逻辑顺序展开研究。论文取得的创新成果如下:
1)提出了端到端长链推理的序列上下文路径选择与重构统一建模方法。现有路径重构方法多采用相邻观测点间局部拼接、显式路径枚举等方案,该方法将路径选择与路径重构统一为“已走路段上文——目标观测下文”条件下的长度可变序列生成范式。
2)提出了数据知识结构嵌入的稳健递归 Logit 建模方法。该方法实现原生递归 Logit 模型稳健参数估计,证明了递归 Logit 可解的充要条件,并提出稳健算法,使 DNN 和 LLM 可以稳定融入效用建模。
3)提出了无偏解析计算的路径可重构性度量方法。针对现有可重构性评估普遍依赖有限路径集截断和理想传感器假设、系统性低估重构不确定性的问题,该方法利用递归 Logit 的结构将完整路径空间中的熵计算转化为路段层面的稀疏线性方程组求解。
接着范镓麟博士进行汇报,他首先介绍了研究背景:随着自动驾驶技术从传统规则化架构向数据驱动的技术范式发展,算法快速迭代高度依赖大规模训练数据。由于现实世界交通场景无限、实车路采数据有限,基于交通仿真的场景生成方法可以利用有限路采数据高效生成仿真训练场景,具有定制化、数据全息和低采集成本等优势,能够为自动驾驶算法训练提供具有双向交互能力且可控的交通流仿真场景,从而形成闭环的算法训练环境。当前面向自动驾驶算法训练的仿真场景生成和仿真训练方法仍面临交通流仿真场景交互真实性不足、高价值长尾训练场景难以靶向生成、仿真训练环境难以支撑自动驾驶算法跨域泛化能力提升等挑战。

汇报时刻
针对以上背景和问题,范镓麟博士构建了涵盖“真实环境底座——靶向场景生成——闭环仿真训练”的技术框架,通过提升仿真场景的交互真实性、覆盖度以及训练方法的泛化性,实现自动驾驶闭环训练的效能提升。论文围绕面向交互真实性的交通流仿真场景建模、面向场景覆盖度的长尾仿真场景靶向生成、面向跨域泛化性的自动驾驶闭环仿真训练展开研究。论文取得的创新成果如下:
1)提出了基于自博弈强化学习的交通流仿真建模方法。面向现有自动驾驶仿真训练环境背景交通流同质化且缺乏逼真博弈交互空间的挑战,该方法实现了多车复杂交互行为的多模态可控仿真;通过引入动态价值均衡估计超参数,将价值评估网络解耦为不同驾驶倾向的多模态估计,并通过元学习技术实现全局动态重构与加权,驱动背景车智能体输出从保守、理性到激进、对抗的连续驾驶行为分布。
2)提出了一种考虑对抗交互合理性的长尾仿真场景靶向生成方法。面向高覆盖度长尾场景的生成需求,该方法在交通流仿真建模框架基础上设计两阶段持续学习框架:第一阶段将物理可达性理论融入多智能体强化学习中,训练可学习的安全约束函数在线量化车辆状态风险,建模符合物理规律的常规交互策略;第二阶段引入自动驾驶主车专家,基于第一阶段优化得到的最小可解安全物理空间,最大化背景车针对主车的靶向对抗强度。
3)构建了基于对抗仿真数据合成与强化微调的自动驾驶闭环仿真训练框架。综合利用多样化交通流环境与长尾安全关键场景,针对现有仿真环境在动态仿真数据生成与支撑算法泛化性能提升上的短板,该框架利用基于组相对优势估计的策略优化算法与混合采样机制,显著提升了算法模型在复杂交互与跨域泛化场景下的闭环交互能力。
最后,由答辩委员会宣读答辩决议,经答辩委员会无记名投票表决,一致同意邱树涵和范镓麟通过博士论文答辩,建议授予工学博士学位。

答辩合影
TOPS全体成员衷心祝贺邱树涵博士与范镓麟博士毕业快乐!愿二位以梦为马、笃行致远,在未来的人生与事业道路上乘风破浪、再启华章!