登录TOPS×

*


*

验证码加载中……

请先拖动验证码到相应位置


——  孙  剑  教  授  课  题  组  ——

第82期组会:秦国阳《出行平台最优延迟匹配策略》

撰稿 邱树涵   2020年10月25日 22:19:48  阅读()

2020年10月22日18:00,TOPS课题组第82期组会在通达馆A436线上线下同时召开。本次组会由15级博士生秦国阳对《出行平台最优延迟匹配策略》的内容进行了汇报。参会人员包括孙剑教授、田野副研究员以及课题组全体成员。

主讲人秦国阳首先从一个有趣的现象出发:即在一个出行平台接客系统中,司机和乘客都以一定的到达率进入系统,在某些情况下,不立即匹配而是延迟一段时间后再匹配,增加司机和乘客的“厚度”,可以使系统中的某些指标例如乘客的总等待时间得到改善。

其次对模型进行抽象,进行了理论上的分析。之后使用强化学习的方法,并对交通模型和强化学习模型都进行了设置和调整,达到更好的结果。

之后将该模型应用到上海的实际数据中,得出的主要结论为当司机和乘客的到达率相近时,使用延迟匹配的效果会更好些。

汇报过程

在讨论环节:张一豪提出了几个问题:(1)是states的参数选取,(2)是reward中对匹配时间和pick up时间的权重如何设置,因为这个权重对强化学习本身的学习收敛也有特殊含义,(3)是experience replay的意义以及和其他类似处理方法的区分。秦国阳都给出了相应的解答。

刘启远从实际应用的角度给出了一点建议,比如通过预测司机的服务结束时间来把该司机以某种方式加入匹配队列,也就是有延迟匹配也有提前匹配。此外就是得出的核心结论可以让出行平台公司更感兴趣一些。

邱树涵从匹配区域网格的划分上提出了疑问,秦国阳介绍从理论上来说,网格划分得细一点,效果也会提升得更多,综合考虑提升效果和算力选择了3*2的网格划分方式。

叶颖俊则从底层的仿真提出了疑问,例如如何体现路网、司机和乘客到达率的设置和估计等。秦国阳给出了更详细的解释,例如司机到达率可以从实际平台中获取、乘客到达率从数据中获取,行程距离则用曼哈顿距离估计。

而张赫从每个网格的“匹配”“不匹配”以及匹配方式提出了疑问,秦国阳解释同为“匹配”的网格连成一个大区域,并在大区域内进行二分匹配,并且是全匹配(直到司机或乘客数为0)。

赵晓聪则对乘客的匹配时间和等车时间的容忍度提出了疑问,因为当乘客不清楚匹配时间的长度,其忍耐能力其实是比较有限的,而延迟匹配会增加匹配时间,或许对乘客的实际体验不是更好的。而秦国阳认为主要考虑的角度还是从系统的角度出发。

最后孙剑老师与田野老师对此研究作了总结和指导,找到与现有研究不同之处和优势。总体来说,秦国阳在一个完整的研究该如何做上为我们做出了示范,大家也收获了很多学术上、技术上的知识和经验。

在组会结束后,叶颖俊给大家分享了做项目的经验,从“什么是横向课题”“横向课题的一般流程”“参加横向课题的作用”三方面来介绍横向课题,大家的反响非常热烈,相信会有更多的同学爱上做项目的。

经验分享ppt

电话:021-69583650  管理员邮箱:2015qgy@tongji.edu.cn  
地址:上海市曹安公路4800号同济大学交通运输工程学院A440  邮编:201804

Creative Commons License TOPS课题组 页面浏览465,829次/访客70,123人次