Page 291 - 测绘新技术的理论与实践研究
P. 291
第八章 互联网背景下测绘智能化关键技术研究
各种异构地理信息数据之间的关联操作。因此,在云计算背景下,能够充分发
挥其海量数据存储管理、分布式并行计算能力的分布式、非关系型数据库系统
NoSQL 概念提出并迅速得到发展,其具有良好的可伸缩性和可扩展性,支持半
结构化、结构化的海量异构数据的高并发存储访问,主要包括以 HBase 为代表
的列数据库、以 MongoDB 为代表的文档数据库、以 Neo4J 为代表的图数据库,
当然与经典的 RDBMS 相比,虽然在存储效率上 NoSQL 优势明显,但是在数据、
索引和查询模型等方面还有待进一步研究。
依据互联网地理信息服务的元搜索模型爬行所得到的泛在地理信息数据特
点,目前主要将其分为 MobileGIS 应用领域中的移动对象数据和 WebGIS 应用领
域中的矢量与栅格空间数据两大类,分别对应处理来源于移动网络智能终端和网
络地图服务的海量互联网地理信息数据,并进一步依据其特性,分别采用不同的
存储架构在云端服务器集群 Hadoop 分布式计算框架系统中进行数据管理。
(一)基于 MongoDB 的移动对象数据库系统
从总体上构建以 Hadoop 为基础平台,分布式元搜索网络爬虫为 Web 节点,
MongoDB 实现底层存储集群实时保存轨迹数据,Redis 实现分布式数据缓存,并
具有 SQL 解析辅助功能的移动对象轨迹数据存储与处理。
其中,抽象数据类型模块包括基础地理数据中点、线、面的定义和轨迹数据
的定义,在此地理信息领域数据定义基础上为插件模块(中间件)提供查询和索
引操作处理模块,依据地理数据的特性在算法库中选择适当的算法完成计算几何、
数据挖掘、时空分析等中间插件接收到来自命令列表的功能需求。移动对象不仅
局限于有位置服务或通信网络服务的泛在智能终端,还可能是出行或迁徙的轨迹、
银行卡的消费记录、网络登录或身份证件的记录等,显然这些移动对象产生的海
量轨迹数据在某种程度上反映了用户或用户群的偏好、事务关联规则和空间行为
模式,这对在互联网泛在地理信息自动发现的移动数据基础上进行态势分析和个
性化服务而言是非常重要的实施前提。
(二)基于 HBase 和 Neo4J 的空间数据云存储
主要由云端虚拟资源层、数据存储层和数据接口层构成。
其中,云端虚拟资源层是由若干服务器集群组成的各种硬件资源,通过虚拟
化资源调度成为动态分布式资源池,为数据存储层提供包括计算虚拟化、存储虚
拟化和网络虚拟化资源;数据存储层依据栅格和矢量空间数据的特征,分别采用
279

