2020年7月2日,TOPS课题组第78期组会在线下和线上同时召开,本次组会由17级硕士生张小卉与大家交流讨论《智能汽车自主决策行为强化学习与应用》的相关内容。参会人员有田野副研究员和课题组成员。
智能汽车的规划决策问题一直是自动驾驶领域的研究重点,但传统建模方法无法遍历所有决策场景成为制约智能车发展的重要因素。随着新一代人工智能的发展,智能汽车的规划决策问题获得了新的解决思路,主讲人张小卉为我们详细讲述了智能汽车如何利用强化学习进行自主决策行为,以达到决策最优的目标。首先张小卉对过去的智能车决策行为研究进行了回顾和总结,并通过对决策行为特点的分析证明了强化学习方法的适用性。随后以安全、高效、舒适、排放等四个指标作为奖惩函数构建了强化学习模型,包括单车最优的Basic DRL模型,基于当前期望速度的SDS DRL模型以及基于SDS的系统优化适应性的Adaptive DRL模型,最后通过单车道环路、双车道环路和上匝道瓶颈系统等测试场景对三个模型进行了评价,评价结果显示模型是有效的。
汇报阶段
在讨论阶段,张一豪对模型验证阶段的开放路网问题和参数迁移问题提出了自己的疑问;李建强对SDS指标的来源进行了再次探讨;田老师肯定了研究成果的意义以及学术价值,并对SDS的线性问题提出了自己的看法。