作品编号:B1313(三等奖)
作品名称:面向手机轨迹数据的道路提取及质量评价
作者单位:中国地质大学(武汉) 地理与信息工程学院
小组成员:汪犇,崔宇然,贾雪璨
指导老师:周琪
1. 背景与意义
随着Web2.0技术的发展,由大众在互联网上贡献的地理信息越来越丰富,它们被称为自发地理信息(Volunteered Geographic Information)[1]。以代表性的自发地理信息平台OpenStreetMap(OSM)为例,它是一个由志愿者提供,并且可以免费获取和使用的全球地图数据库,且以道路数据居多。当前,大部分的OSM数据是由用户基于遥感影像数据的矢量化获得[2]。然而,由于树木、高层建筑等障碍物遮挡的原因,并非所有的道路都能在遥感影像中看到并被矢量化(图1)[3],以居住小区和机关大院的内部道路最为典型,其特点是:道路宽度窄、道路等级低、车流量较小。因此,亟待发开一种针对这类道路的提取方法,服务于大众用户自发获取更多的地理信息数据[4-5]。我们的思路是:针对智能手机已经普及的现状,提出从手机获取的轨迹数据中自动提取道路的方法。
图1 中国地质大学(武汉)北校区卫星影像截图(源自谷歌地球)
2. 设计思想
图2是设计思想的技术路线图,包括数据采集、道路提取和质量评价三个方面。
图2 技术路线图
2.1数据采集
基于现有的智能手机硬件系统(如苹果或安卓系统),下载可以免费获取手机轨迹数据的APP应用程序软件(如GPS Logger和Geo Tracker),让用户自发地获取手机轨迹数据(通常为点数据);然后,导入到ArcGIS平台进行道路提取与分析。
2.2道路提取
设计针对手机轨迹数据(图3a)的道路自动提取方法,基本原理如下。首先,对手机轨迹数据进行缓冲区分析,得到道路面状要素(图3b);其次,对面状要素进行细化,获得道路中心线(图3c);最后,对道路中心线进行简化,获得符合道路形态的道路中心线数据(图3d)。
图3 道路提取方法示意图
2.3质量评价
为了验证该方法的有效性,我们拟选取研究区域进行测试,并从天地图(网络地图)中矢量化道路数据作为参考,通过对比参考道路数据,评价由手机轨迹数据自动提取的道路中心线的数据质量。考虑了如下三个方面的质量评价指标:几何精度,完整性和拓扑一致性[6]。
①几何精度(
):即自动提取的道路数据与参考道路数据的偏差,计算公式如下。
其中,为自动提取的道路数据的节点总数;为自动提取的道路数据中的节点i到参考道路数据的最近距离。
②完整性():自动提取的道路数据长度与参考道路数据长度之比,计算公式如下。
其中,为自动提取的道路数据总长;为参考道路数据总长。
③拓扑一致性():自动提取的道路数据的道路交叉口总数与参考道路数据的道路交叉口总数之比,计算公式如下。
其中,为自动提取的道路数据的道路交叉口总数;为参考数据的道路交叉口总数。
3. 主要功能
3.1道路提取功能简介
图4 道路提取功能的实现流程
道路提取功能的实现流程如图4所示,具体步骤如下:
- 导入手机轨迹数据(GPX格式),使用“GPX转要素”工具,将其转换为点要素;
- 使用“投影”工具,投影点要素到投影坐标系(如WGS_1984_Web_Mercator);
- 使用“缓冲区”工具,生成点要素的缓冲区;
- 使用“要素转栅格”工具,转换缓冲区为栅格数据;
- 使用“栅格细化”工具,细化栅格数据;
- 使用“栅格转折线”工具,转换细化后的栅格数据为线要素;
- 使用“线简化”工具,简化得到的线要素,并提取道路的中心线。
3.2道路质量评价功能简介
①几何精度评价
- 使用“要素折点转点”工具,获得自动提取的道路数据的所有节点;
- 使用“生成近邻表”工具,计算每一个节点到参考道路数据的距离;
- 使用“统计数据”功能,计算属性表中所有节点的距离平均值。
②完整性评价
- 使用“计算几何”功能,计算自动提取的道路数据和参考道路数据的线段长度;
- 使用“属性表统计”功能,统计所有线段的道路总长;
- 计算自动提取的道路数据总长与参考道路数据总长的比值。
③拓扑一致性评价
- 使用“要素折点转点”工具,获得自动提取的道路数据的所有节点;
- 使用“空间链接”工具,空间链接各个节点;
- 使用“筛选”工具,筛选出相邻道路段数量大于2的节点,视作道路交叉口;
- 使用“统计”功能,统计自动提取的道路数据和参考道路数据的道路交叉口数量;
- 计算自动提取的道路数据与参考道路数据的道路交叉口数量的比值。
4. 结果展示
以中国地质大学(武汉)北校区为实验区域(图1),该区域内道路总长约为3.5公里,且因树木遮挡较难从遥感影像上直接获取。本作品提出的方法中有两个可能会影响道路提取结果的重要参数(缓冲区半径和简化容差),需要进行讨论。图5和表1为多组参数的道路数据提取结果的对比及质量评价。
表1 多组参数的道路数据提取结果的质量评价
缓冲区半径(m) | 简化容差(m) | 几何精度 | 完整性 | 拓扑一致性 |
5 | 5 | 4.65 | 0.88 | 0.71 |
5 | 10 | 4.67 | 0.87 | 0.71 |
5 | 20 | 4.59 | 0.86 | 0.71 |
10 | 5 | 4.44 | 0.99 | 1.25 |
10 | 10 | 3.83 | 0.98 | 1.25 |
10 | 20 | 3.81 | 0.97 | 1.25 |
20 | 5 | 7.42 | 0.96 | 1.42 |
20 | 10 | 7.53 | 0.95 | 1.42 |
20 | 20 | 7.22 | 0.94 | 1.42 |
图5 多组参数的道路数据提取结果对比
由图5可以看出:不同参数设置对道路自动提取的结果影响较大。例如,当缓冲区半径设置过小(如5米时),道路的拓扑结构可能被破坏或者出现有很多断开的道路段(图5b,5c和5d);然而,当缓冲区半径设置过大(图5h,5i和5j),道路网形成的街区形状可能生产较大变形(图5g和5h)。类似地,当简化容差设置过小(如5米时),道路形态(直线状)可能未被保留(图5e)。
进一步,由表1也可以看出:缓冲区半径对道路自动提取的结果影响较大,且缓冲区半径设置为10米时达到最优,即几何精度介于3.8-4.4之间;完整性和拓扑一致性接近1。相对而言,简化容差对自动提取的道路数据质量影响相对较小。
5. 特点及展望
针对基于遥感影像获取地理信息可能因树木、建筑等遮挡的不足,本作品设计出面向(智能)手机轨迹数据的道路提取功能,及道路质量的评价功能。该作品的设计思路简单、自动化程度高,且面向手机轨迹自动提取的道路数据精度较高(平均精度4米左右)、完整性较好,还能较好地保持拓扑一致性。上述功能不仅能应用于从手机轨迹数据提取道路,还能应用于从其他设备(如手持GPS、出租车)获取的轨迹数据中提取道路,只需要对最优参数进行重新实验与调整。另一方面,上述功能不仅有助于大众用户自发获取更多的地理信息数据,还可能有助于工程设计人员和研究学者自动采集道路数据,因此有较大的应用前景。
参考文献
- Jonathan J.Davies,Alastair R.Beresford,Andy Hopper.Scalable,Distributed, Real-Time Map Generation[J].pervasive computing,2006,05(04):47-54.
- Mordechai Haklay,Patrick Weber. OpenStreetMap: User-Generated Street Maps[J]. pervasive computing,2008,07(04):12-18.
- Lee S, Lee D, Lee S. Network-oriented road map generation for unknown roads using visual images and GPS-based location information[J]. IEEE Transactions on Consumer Electronics,2009, 55(3):1233-1240.
- Liu X,Zhu Y,Wang Y,et al.Road Recognition using Coarse-grained Vehicular Traces[J].Hp Labs,2012.Liu X,Zhu Y,Wang Y,et al.Road Recognition using Coarse-grained Vehicular Traces[J].Hp Labs,2012.
- 陆晓燕. 基于公交车大数据挖掘的城市路网自动生成与实时更新算法研究[D].山东大学,2015.
- Mahdi Hashemi. A testbed for evaluating network construction algorithms from GPS traces[J]. Computers, Environment and Urban Systems,2017,66:96-109