4月20日下午2:00-3:30,第495期同路人学术论坛于36365线路检测中心no1(通达馆)103会议室成功举行。本次讲座的主题为:Data Science Behind Smart Transportation: from theory to the real world。讲座邀请了来自携程集团的马江山算法总监为大家带来了精彩的报告。
首先,马博士介绍了自己的学习经历和职业经历,讲述了自己研究方向转变的逻辑,从model到algorithm再到原型和测试,并展示了自己的成果。
接着,马博士介绍了大数据的概念。大数据包括数据采集、通信、存储、计算、应用等一系列过程。数据采集一般使用服务器、传感器等以文件或流的形式采集数据。通信包括物理层和网络层的通信。通信协议有http、mqtt等。数据存储早期使用san/nas等集中式的存储。分布式存储现在有s3/oss/hdfs等方式。计算层包括hive SQL、 spark、 flink。应用层面包括商业智能、数据分析、人工智能等多个方向。
然后,马博士介绍了几种标准化的产品。第一,以政策为导向的标准化的产品。在微观层面包括vissim、paramivs。中观层面包括aimsun、matsim。宏观层面包括transCAD、EMME/2。第二,以实施为导向的高度标准化的产品主要是信号控制系统,包括scats,scoot,hkvision,didi,openatc。视觉为导向的产品包括智慧城市、数字孪生等。而这些产品都指向了两个问题:这些产品的设计和使用是否合理以及如何评估这些产品优劣。
然后,马博士讲述了实际公交运营的案例。在研究案例中,使用聚类分析来研究公交需求,并通过动态规划来给出初步开线结果,最后进行人工调整。在拼车算法当中,马博士用了等多重方式进行了计算,并通过仿真模拟线下的运营情况,接着通过测试数据进行修改。智慧比价算法逻辑是从物料库中召回数据,进行粗排、精排和重排,并最终推荐给用户。
最后,马博士向同学们推荐了一些经典的工具书供大家学习,并解答了同学们对行业信息收集、机票联乘的疑问。