登录TOPS×

*


*

验证码加载中……

请先拖动验证码到相应位置


——  孙  剑  教  授  课  题  组  ——

第145期组会:王思涵《基于主客观映射模型的自动驾驶车辆智能度评价》刘佳琦《基于Transformer模型的自动驾驶自进化决策研究》

撰稿 肖灵坤   2024年06月29日 22:16:27  阅读()

    2024年6月19日,TOPS第145期组会于通达馆A102线下举行。本次组会由22级硕士生王思涵刘佳琦带来自己的研究进展汇报,分别与大家讨论交流《基于主客观映射模型的自动驾驶车辆智能度评价》和《基于Transformer模型的自动驾驶自进化决策研究》。课题组全体老师同学出席了本次组会。

    首先由王思涵同学带来基于主客观映射模型的自动驾驶车辆智能度评价研究汇报。汇报主要涵盖研究背景与研究现状、研究内容与研究进展及后续研究计划等几个方面。在研究背景部分,王思涵同学解释了自动驾驶汽车智能度评价的重要性。目前,现行的高等级自动驾驶汽车智能度评价维度单一,仍存在测试场景随机、边界场景难以覆盖等问题,导致成本高、效率低、测试周期长等问题。在研究现状方面,王思涵同学指出,自动驾驶车辆的行为是车辆自身特性和驾驶场景特性的综合结果。因此,智能度评价应包含驾驶行为表现与场景复杂度两个维度。目前,人类对自动驾驶的主观感受是智能度评价的重要依据,但主观评价存在效率低、量化程度低等问题,而客观评价则需要明确合理的阈值或定量标准。在研究内容方面,王思涵同学提出了基于整车级指标建立多维度多准则评价指标库,结合场景复杂度和驾驶行为二维评价模型,建立智能度主客观映射模型。研究内容包括驾驶行为评价指标库和场景复杂度评价指标库的建立,以及智能度评价方法的确定和验证。最后,王思涵同学展望了未来工作,计划通过动态复杂度计算方式调整和模型参数调整等优化场景复杂度模型,并开展更多主客观实验,进一步完善和验证智能度评价模型。


图形用户界面, 网站 描述已自动生成

汇报时刻


图形用户界面 描述已自动生成

汇报内容


    随后,刘佳琦同学带来基于Transformer模型的自动驾驶自进化决策研究汇报。汇报主要涵盖研究背景及现状、研究内容概述、基于离线预训练的GPT决策、基于微调的决策在线更新(自进化)以及未来工作五个方面。在研究背景部分,刘佳琦同学解释了自进化与持续学习能力对于自动驾驶决策系统的重要性。刘佳琦同学指出,目前基于学习的决策算法在复杂场景的决策中展现出巨大潜力,但仍面临多任务泛化能力和持续学习能力等方面的挑战。特别是强化学习算法在实际应用中存在策略过拟合、可解释性和可控性较差等问题。在研究内容方面,刘佳琦同学提出了基于GPT序列建模的自动驾驶决策学习范式,构建了基于RL专家采样的策略建模与多任务数据集采集流程,并通过构建决策GPT模型,提升数据驱动的自动驾驶决策算法的泛化能力。同时,还介绍了基于策略微调的自动驾驶决策在线更新方法,通过熵正则化和策略优化微调实现模型的在线更新。刘佳琦同学还展示了实验结果,证明了MTD-GPT模型在多个子任务中均表现出良好的多任务学习能力,能够逼近或超越单任务RL专家模型性能。最后,刘佳琦同学展望了未来工作,计划通过在线仿真实验、域控在环实验和虚实融合实验三个层次对模型进行验证,并进一步完善和优化决策模型的性能。


图形用户界面 描述已自动生成

汇报时刻


图形用户界面, 应用程序 描述已自动生成

汇报内容


    在讨论环节,课题组各位老师针对两位同学的汇报内容提出了宝贵的建议。秦国阳老师指出在研究中大众的认可度的问题。岳李圣飒老师提出需要注意客观权重和主观权重之间的关联度。梁浩阳老师指出在解决决策问题时大模型的局限性,建议后续进行扩展。孙杰老师对技术路线和方法论的具体细节进行了进一步讨论并提出相应建议。


电话:021-69583650  管理员邮箱:2015qgy@tongji.edu.cn  
地址:上海市曹安公路4800号同济大学交通运输工程学院A440  邮编:201804

Creative Commons License TOPS课题组 页面浏览465,829次/访客70,123人次