概要
该项目使得能够研究在轨迹之间寻找相似性的问题(轨迹相似性问题),这是数据挖掘领域中的已知问题。 称为部署和解决上述问题的算法是LCSS(最长公共子序列)。 每个轨道由一个序列的地理点(纬度,经度)描述。 我们提供的每个记录数据集都代表在北京市内发生的出租车的路径。 文件的每一行均包含以下内容,并以逗号分隔:出租车ID,时间戳记,纬度,经度。
背景
我们提供的每个记录数据集都代表在北京市内发生的出租车的路径。 文件格式的一个说明性示例是:
366,Mon Mar 03 00:05:59 EET 2014,39.90732,116.45353 366,Mon Mar 03 00:10:59 EET 2014,39.90729,116.45348 366,Mon Mar 03 00:15:59 EET 2014,39.90725,116.45334 366,周一3月3日00:20:59
1