南京大学学报(自然科学版) ›› 2020, Vol. 56 ›› Issue (2): 227–235.doi: 10.13232/j.cnki.jnju.2020.02.008

• • 上一篇    下一篇

基于历史出行记录扩充的公交乘客下车站点推算方法

崔紫薇,王成(),陈德蕾,雷蕾   

  1. 华侨大学计算机科学与技术学院,厦门,361021
  • 收稿日期:2019-10-26 出版日期:2020-03-30 发布日期:2020-04-02
  • 通讯作者: 王成 E-mail:wangcheng@hqu.edu.cn
  • 基金资助:
    国家自然科学基金青年基金(51608209);福建省自然基金(2017J01090);福建省引导性计划(2019H0017);泉州市科技计划(2018Z008);华侨大学研究生科研创新能力培育计划(17013083017);华侨大学研究生教育教学改革研究立项项目(18YJG28)

Alighting stop determination of transit passengers based on expanded history trip records

Ziwei Cui,Cheng Wang(),Delei Chen,Lei Lei   

  1. College of Computer Science and Technology, Huaqiao University, Xiamen, 361021, China
  • Received:2019-10-26 Online:2020-03-30 Published:2020-04-02
  • Contact: Cheng Wang E-mail:wangcheng@hqu.edu.cn

摘要:

用出行链方法推算的下车站点的记录可作为历史出行数据集,而现有的研究在对出行链断裂的记录进行下车站点推算时使用的历史数据集较小,造成可推算下车站点数据量少、准确率低的缺点.提出基于历史出行记录扩充的公交乘客下车站点推算方法.首先,使用多源数据集成的出行链方法进行下车站点推算,将已确定下车站点的数据作为历史数据集;其次,基于个人历史相似出行的方法对于未确定下车站点的记录进行推算;最后,选择同线路同站点上车的其他乘客的IC卡记录作为每条未识别下车站点记录的群体历史出行记录,并基于相似出行行为规律进行下车站点的推算.该方法增加了可推算下车站点记录的数据量、提高了推算的准确率.以厦门市为例的实验结果表明:在历史出行记录生成时,使用多源数据可比单源数据多生成3.48%历史出行记录,推算准确率提高1.99%;在历史出行记录选择时,选择群体历史出行记录分析得到的历史相似出行行为规律,可对前两种方法无法确定下车站点的所有记录进行推算,占全部待推算记录的21.81%,其中5.37%记录的下车站点推算正确.

关键词: 下车站点推算, 历史出行记录扩充, 多源数据集成, 出行链, 个人历史相似出行, 群体历史相似出行

Abstract:

Records determined alighting stops based on trip?chain are used as historical trip records. The existing researches use smaller historical datasets when determining the recordes destinations of unlinked trips,which results less data quantity and low accuracy in estimating alighting stops. Thus,this paper proposes a method for alighting stop determination of transit passengers based on expanded history trip records. Firstly,the trip?chain method of multi?source data is used to estimate alighting stops,and data with destinations is used as the historical dataset. Then,records without alighting stops are decided destinations based on the method of personal historical with similar trips. Finally,IC card records of other passengers boarding at the same stop on the same line are selected as the group history trip records,and alighting stops are determined based on the behavior rules of group history similar trips. This proposed method increases the number of records with alighting stops and improves the accuracy of destination determinations. A study case of Xiamen shows that when generating historical trip datasets in the trip?chain method,3.48% more records can be generated using multi?source data than single?source data,and the accuracy of the former is 1.99% higher than that of the latter. When choosing records as the group historical trip dataset to analyze the historical similar behavior rules,the proposed method can estimate all destinations of records which can not be determined by other two methods,accounting for 21.81% of the total estimated records,of which 5.37% records are correct.

Key words: alighting stop determination, expansion of historical trip records, multi?source data integration, trip?chain, personal history similar trips, group history similar trips

中图分类号: 

  • U491

图1

海量数据时基于历史出行记录扩充的公交乘客下车站点推算方法示意图"

图2

基于历史出行记录扩充的公交乘客下车站点推算方法流程图"

表1

常规公交乘客IC卡数据示例"

字段样例
卡号158****539
交易日期20181101
交易时刻28800
线路号955
车辆编号闽***852
上车站点名称华侨大学站
上车站点编号5
上车站点经度118.093048
上车站点纬度24.604286
上下行标志

表2

BRT/轨道交通乘客IC卡数据示例"

字段样例
刷卡终端类型轨道交通
卡号750****715
交易日期20181101
交易时刻27940
站点名镇海路站
经度118.088848
纬度24.456642
进出站进站

图3

乘客的公共交通出行链闭合示意图"

表3

本文方法与典型下车站点推算方法的理论比较"

下车站点

推算方法

扩充历史出行数据集的方法

本文使用

方法及顺序

使用数据适用范围
基于出行链的方法[5,6,7,8,9,10]历史出行数据集的生成常规公交已知上车站点信息的IC卡数据、常规公交GPS数据、静态线路站点数据一日有多次出行且常规公交出行链完整
基于多源数据集成的出行链方法1常规公交、轨道交通和BRT已知上车站点信息的IC卡数据、常规公交GPS数据、静态线路站点数据一日有多次出行且公共交通(常规公交、轨道交通和BRT)出行链完整
基于个人历史相似出行的方法[16]历史出行数据集的选取2单个乘客在同一站点上车的已识别下车站点数据作为历史出行数据集、静态线路站点数据公共交通出行链断裂、单个乘客具有较强历史出行规律
基于群体历史相似出行的方法3同一站点上车其他乘客的已识别下车站点数据作为历史出行数据集、静态线路站点数据公共交通出行链断裂、乘客的出行规律服从群体的分布

表4

多源数据与单源数据情况下使用出行链方法进行下车站点推算的结果"

方法数据源Numiden(条)IdenRateNumidenright(条)Accuracy
由下一次出行推算

单源

数据

上下车站点全在BRT1号线沿线的IC卡记录122022933.22%102450483.96%
由当日首次出行推算107698629.32%78953873.31%
由下一次出行推算

多源

数据

上下车站点全在BRT1号线沿线的IC卡记录,上车站点在但下车站点不在BRT1号线沿线的IC卡记录129802735.34%110513285.14%
由当日首次出行推算112707430.68%85812476.14%

表5

基于历史出行记录扩充的公交乘客下车站点推算方法的结果"

方法Numiden(条)IdenRateNumidenright(条)Accuracy
共计3673184100.00%227992662.07%
基于多源数据集成的出行链下车站点推算方法242510166.02%196325680.96%
基于个人历史相似出行的方法44691512.17%27362861.23%
基于群体历史相似出行的方法80116821.81%430425.37%

图4

各种卡类型IC卡记录数量的占比"

图5

各种卡类型的下车站点推算准确率变化"

图6

一天各时间段内的下车站点推算准确率的变化"

1 He L,Nassir N,Trépanier M,et al.Validating and calibrating a destination estimation algorithm for public transport smart card fare collection systems.CIRRELT?2015?52.
2 Devillaine F,Munizaga M,Trépanier M.Detection of activities of public transport users by analyzing smart card data.Transportation Research Record:Journal of the Transportation Research Board,2012,2276(1):48-55.
3 张萌萌,郭亚娟,马玉娇.基于站点吸引的公交客流OD分布概率模型.交通信息与安全,2014,32(3):57-61.
Zhang M M,Guo Y J,Ma Y J. A probability model of transit OD distribution based on the allure of bus station. Journal of Transport Information and Safety,2014,32(3):57-61.
4 徐文远,邓春瑶,刘宝义.基于公交IC卡数据的公交客流统计方法.中国公路学报,2013,26(5):158-163.
Xu W Y,Deng C Y,Liu B Y.Approach on public traffic passenger flow statistics based on IC data. China Journal of Highway and Transport,2013,26(5):158-163.
5 Munizaga M A,Palma C.Estimation of a disaggregate multimodal public transport origin–destination matrix from passive smartcard data from Santiago,Chile.Transportation Research Part C:Emerging Technologies,2012,24:9-18.
6 Zou Q R,Yao X M,Zhao P,et al.Detecting home location and trip purposes for cardholders by mining smart card transaction data in Beijing subway.Transportation,2018,45(3):919-944.
7 吴祥国.基于公交IC卡和GPS数据的居民公交出行OD矩阵推导与应用.硕士学位论文. 济南:山东大学,2011.
Wu X G.Urban public transportation trip OD matrix inference and application based on bus IC card data and GPS data. Master Dissertation. Jinan:Shandong University,2011.
8 Nunes A A,Dias T G,Cunha J F E.Passenger journey destination estimation from automated fare collection system data using spatial validation.IEEE Transactions on Intelligent Transportation Systems,2016,17(1):133-142.
9 He L,Trépanier M.Estimating the destination of unlinked trips in transit smart card fare data.Transportation Research Record,2015,2535(1):97-104.
10 钱易.基于多日公交IC卡数据与AVL数据的公交OD推算方法研究.硕士学位论文. 成都:西南交通大学,2017.
Bus passenger OD matrix inference based on multi?day IC card data and AVL data. Master Dissertation. Chengdu:Southwest Jiaotong University,Qian Y.2017.
11 Kumar P,Khani A,He Q.A robust method for estimating transit passenger trajectories using automated data.Transportation Research Part C:Emerging Technologies,2018,95:731-747.
12 Nassir N,Hickman M,Ma Z L.Activity detection and transfer identification for public transit fare card data.Transportation,2015,42(4):683-705.
13 Sánchez?Martínez G E.Inference of public transportation trip destinations by using fare transaction and vehicle location data:dynamic programming approach.Transportation Research Record:Journal of the Transportation Research Board,2017,2652(1):1-7.
14 胡继华,邓俊,黄泽.结合出行链的公交IC卡乘客下车站点判断概率模型.交通运输系统工程与信息,2014,14(2):62-67, 86.
Hu J H,Deng J,Huang Z.Trip?chain based probability model for identifying alighting stations of smart card passengers. Journal of Transportation Systems Engineering and Information Technology,2014,14(2):62-67, 86.
15 李佳怡,张锦,张静文等.城市公交乘客下车站点推算方法和有效性评价.武汉大学学报·信息科学版,2018,43(8):1172-1177.
Li J Y,Zhang J,Zhang J W,et al.An algorithm to identify passengers' alighting stations and the effectiveness evaluation. Geomatics and Information Science of Wuhan University,2018,43(8):1172-1177.
16 邬群勇,苏克云,邹智杰.基于MapReduce的海量公交乘客OD并行推算方法.地球信息科学学报,2018,20(5):647-655.
Wu Q Y,Su K Y,Zou Z J.A mapreduce?based method for parallel calculation of bus passenger origin and destination from massive transit data. Journal of Geo?information Science,2018,20(5):647-655.
17 Yan F F,Yang C,Ukkusuri S V.Alighting stop determination using two?step algorithms in bus transit systems.Transportmetrica A:Transport Science,2019,15(2):1522-1542.
No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 段新春,施 斌,孙梦雅,魏广庆,顾 凯,冯晨曦. FBG蒸发式湿度计研制及其响应特性研究[J]. 南京大学学报(自然科学版), 2018, 54(6): 1075 -1084 .
[2] 谢探春, 王国兵, 尹 颖, 郭红岩. 柳树对镉-芘复合污染土壤的修复潜力与耐受性研究[J]. 南京大学学报(自然科学版), 2019, 55(2): 282 -290 .
[3] 钱付兰, 黄鑫, 赵姝, 张燕平. 基于路径相互关注的网络嵌入算法[J]. 南京大学学报(自然科学版), 2019, 55(4): 573 -580 .
[4] 刘瑞红,王晖,陶农建. 电位调制下单纳米颗粒的等离激元成像研究[J]. 南京大学学报(自然科学版), 2019, 55(5): 813 -818 .
[5] 徐扬,周文瑄,阮慧彬,孙雨,洪宇. 基于层次化表示的隐式篇章关系识别[J]. 南京大学学报(自然科学版), 2019, 55(6): 1000 -1009 .
[6] 刘作国,陈笑蓉. 汉语句法分析中的论元关系模型研究[J]. 南京大学学报(自然科学版), 2019, 55(6): 1010 -1019 .
[7] 柴变芳,魏春丽,曹欣雨,王建岭. 面向网络结构发现的批量主动学习算法[J]. 南京大学学报(自然科学版), 2019, 55(6): 1020 -1029 .
[8] 黄华娟,韦修喜. 基于自适应调节极大熵的孪生支持向量回归机[J]. 南京大学学报(自然科学版), 2019, 55(6): 1030 -1039 .
[9] 郭小松,赵红丽,贾俊芳,杨静,孟祥军. 密度泛函理论方法研究第一系列过渡金属对甘氨酸的配位能力[J]. 南京大学学报(自然科学版), 2019, 55(6): 1040 -1046 .
[10] 段友祥,柳璠,孙歧峰,李洪强. 基于相带划分的孔隙度预测[J]. 南京大学学报(自然科学版), 2019, 55(6): 934 -941 .