2024年4月20日发(作者:)

轨迹数据分类

轨迹数据是对移动对象的运动过程采样得到的数据,通常包含采样位置、时间、运动速

度等属性信息。将采样点按照一定时间尺度排序便形成了移动对象的轨迹[1]。根据采样方

式和驱动因素的不同,将轨迹数据分为以下3类:①基于时间采样的轨迹数据,即按等时

间间隔对移动对象进行采样形成的轨迹;②基于位置采样的轨迹数据,即移动对象位置发生

变化即被记录而形成的轨迹;③基于事件触发的轨迹数据,即移动对象触发传感器事件后而

被记录下来形成的轨迹[2]。

基于时间采样的轨迹数据

基于时间采样的轨迹数据基于时间采样的轨迹是等时间间隔记录移动对象的信息,或扫

描全局通过反演移动对象位置而获得的数据,前者如车载GPS数据、动物迁徙数据,后者

如飓风数据、涡旋数据等。

基于时间采样的轨迹可用以下模型表达,即以等长的时间间隔记录移动个体的位置[3]。

Tr

代表一条时空轨迹,

St

代表起始时间,

T

代表时间记录间隔,序列中(

X

n

Y

n

St

+

(n-1)*

T

)代表在

St

+(n-1)*

T

时刻,轨迹对象在二维时空的位置为(

X

n

Y

n

)。

基于时间采样的轨迹数据具有数据量大、覆盖范围广的特点。但未考虑数据的代表性,

会造成数据冗余、数据遗漏,如车载GPS在车辆状态没有发生变化时仍然收集数据,传输

过程中往往出现传感器信号丢失以致数据遗漏,且轨迹数据依赖局限于交通路网[2]。

绝大多数的轨迹研究都立足于此,他们从大量轨迹数据中提取出行模式和交通状况。他

们或将访问地点按频率排序可以用来提取个体用户的出行模式[4],或从集体轨迹信息入手,

推测城市活动的热点规律模式。Wu(2013)等认为在轨迹数据中寻找的热点的动态模式可

以用来揭示历史事件和预测未来活动热点,这也许对交通和公共安全很有价值。将活动热点

按时序排列,整理成库。可以显示了城市热点在时空上是如何形成,消失等过程。还探索了

地区工作日与休息日的模式区别,并建立数据库用来预测将来地区模式[5]。

基于位置采样的轨迹数据。

基于位置采样的轨迹是当采样对象位置发生变化时记录其位置、时间、属性信息而获得

的数据,如居民出行调查、人口迁徙统计数据等。基于位置变化采样的轨迹可由移动对象位

置变化的节点序列表示[3],模型表达如式(2),即以离散位置变化节点记录移动个体的轨迹

信息。

其中

X

n

X

n1

Y

n

Y

n1

,且

T

1

T

n

Tr

代表时空轨迹,该序列中的(

X

n

Y

n

T

n

代表在时刻

T

n

,轨迹对象在二维空间的位置为(

X

n

Y

n

)。

基于位置采样的轨迹数据以移动对象的位置变化为关注重点,具有属性信息丰富、轨迹

位置变化详细等特点。但这类数据收集主要依靠人工操作,缺乏自动采集装置,导致数据整

理过程耗时耗力、调查范围有限、更新周期长、空间位置需要二次匹配等一系列问题[2]。

这类轨迹数据最为典型的就是OD流。OD(Origin—Destination)流指轨迹中起点到终点

的流动性特征,其中0表示出行起点,D表示出行终点。OD流从统计的角度反映移动对象

的活动和群体轨迹的动态特征。利用OD流可以发现上车点和下车点密度的空间分布,从而

可以识别出城市某些特定位置(如火车站、飞机场等)[6]。当然也可以对人口迁移进行分

析,对他们的主要来源地与主要迁移地进行统计分析与可视化显示,可以得到人口迁移的规

律,发现暗含其中的社区结构[7]。Zhang等(2012)对出租车数据进行OD流聚类分析,找

出聚类中心,添加起始点语义信息,发现OD流的语义,如车站一车站、商场一车站等[8]。

基于事件触发采样的轨迹数据

基于事件触发采样的轨迹是移动对象触发传感器事件后,移动对象的位置、时间及其他

属性信息被记录下来的数据,如手机通话,手机连接wifi热点,公交卡、银行卡等智能卡刷

卡,用户签到等事件。若移动对象未触发传感器事件,其移动轨迹则不能被记录。虽然移动

对象的时空轨迹是连续的,但只有移动对象触发传感器事件发生时,位置、时间信息才有记

录,因此此类时空轨迹可以由一组离散的时空记录点序列表示,如式(3)所示:

其中

T

1

T

n

,(

X

n

Y

n

)与(

X

n1

Y

n1

)有可能相等,

Tr

代表时空轨迹,该序列中的

X

n

Y

n

T

n

)代表在时刻

T

n

,轨迹对象在二维空间的位置为(

X

n

Y

n

)。

基于事件触发采样的轨迹数据具有数据量大、覆盖范围广、更新周期短、采样对象具有

代表性等特点。但此类轨迹数据记录的位置不一定是移动对象的真实位置,导致轨迹数据的

空间分辨率不高。如手机通话事件的位置是用基站服务范围(以基站为标识点的Voronoi多

边形)近似表示,位置精度取决于基站的密集程度,且只有传感器事件被触发时才记录移动

对象的相关信息,无法勾勒移动对象详尽的轨迹信息,只是人类行为活动中的快照[2]。

位置签到数据是利用待遇GPS的智能终端记录某一时刻所处位置而产生的具有空间

性,实践性和社会化的属性信息的数据,他记录生活轨迹,反映人的日常生活行为,是一种

重要的众源地理数据。[9]

Hu等(2014)在文章中提出了利用位置签到数据探索城市热点与商圈研究。为及时、

准确探测城市热点和客观高效分析商圈,提出一种基于社交网络众源位置签到数据的城市热

点探测与商圈挖掘方法。位置签到数据是具有空间坐标和用户属性的离散 GIS 点对象, 首

先对离散签到数据进行格网化处理, 将大数据量、离散签到位置点转化成具有空间连续性与

邻接性并能够更好地反映签到事件集聚密度的格网数据。其次, 运用探索性空间数据分析

( exploratory spati al data anal ysi s, ESDA) 度量签到数据的空间相关性, 量算其空间结构

和全局分布模式, 以确定热点探测和商圈聚类的最佳模式。再次, 采用聚类分析识别出具有

统计显著性的热点、冷点和空间异常值位置。最后, 通过度量聚类分析结果的地理空间分布,

得到具有统计显著性的聚类地理要素的空间特征::包括商圈范围、 中心变化趋势和方向发

展趋势。

[1]Li, X., Han, J., Kim, S., & Gonzalez, H. (2007). Roam: rule- and motif-based anomaly detection in

massive moving object data sets..Proceedings of Siam International Conference on Data Mining.

[2]李婷, 裴韬, 袁烨城, 宋辞, 王维一, & 杨格格. (2014). 人类活动轨迹的分类、模式和应用研究综述.

理科学进展

, 33, 7.

[3]Nanni M.2002.Clustering methods for spatio—temporal data.Pisa,Italy:University of Pisa.

[4]Alvares, L. O., Fernandes, J. A., Macedo, D., Bogorny, V., Moelans, B., & Kuijpers, B., et al. (2007). A

model for enriching trajectories with semantic geographical information. in ‘ACM-GIS’, ACM.

[5] Lu, R. W. S. Y. (2014). Detection of dynamic activity patterns at a collective level from large-volume

trajectory data. International Journal of Geographical Information Science, volume 28, 5, 946-963.

[6]Veloso M, Phiyhakkitinukoon S, Bento C.(2011). Urban mobility study using taxi

traces.2011. Intemational workshop on trajectory data mining and analysis.Beijing,China: September

18,2011.

[7]

Guo, D. (2009). Flow mapping and multivariate visualization of large spatial interaction data.

Visualization & Computer Graphics IEEE Transactions on, 15, 6, 1041-1048.

[8 Zhang, W, Li ,S, Pan ,G(2012) Mining the Semantics of Origin-Destination Flows Using Taxi Traces.

In Proceedings of the 2012 ACM Conference on Ubiquitous Computing Pp. 943–949.

[9] 胡庆武, 王明, & 李清泉. (2014). 利用位置签到数据探索城市热点与商圈. 测绘学报, 3.