Page 285 - 测绘新技术的理论与实践研究
P. 285

第八章 互联网背景下测绘智能化关键技术研究

             构、信息来源等多因素构成的特征空间,采用向量空间模型 VSM 构建互联网地

             理信息的类别相似度评价模型;在地理信息元搜索引擎的支持下,随机选取包括
             地名地址服务类、地理标注类、静态地图类、TMS 交互地图类、OGC-WMS 服
             务类和矢量数据服务类等典型地图网站进行样本学习,形成各因素的特征权重,
             并采用 TF-IDF 方法进行类别相似度计算。同理,面向各类互联网地理信息,建

             立基于 VSM 的结构特征计算模型和计算方法,完成对特定类型互联网地理信息
             几何数据结构特征(点、线、面等坐标信息的存储方式)、图像组织结构(单幅

             静态图像、多幅拼接图像在页面中的组织方式)、语义结构(名称模式、属性组
             织方式)。
                 (二)多态地理信息内容萃取
                 采用柔性软件架构技术,设计统一的软件接口和灵活的扩展机制,构建面向

             各类互联网地理信息的解析构件库,自主研发基于动态加载技术的地理信息解析
             构件驱动引擎,实现基于类别族谱对互联网地理信息进行精确解析,实现对地理
             对象名称信息、空间属性、专题属性、访问属性、来源属性等信息的精确提取;

             将非文本的矢量信息与影像信息的特征信息抽取出来,采用版本管理技术,对各
             类地理信息解析构件进行全周期管理。
                 矢量信息的提取与处理:按在网络上矢量信息存在或表达的方式可大致分为
             四大类,即 OGC 标准服务提供的 GML 结构的矢量数据、KML/KMZ 结构的矢

             量数据处理、Shape 格式的矢量数据以及专用的 POI 地理标注,针对不同结构矢
             量数据的解析,提取名称、空间、坐标系、属性及其说明等特征信息,并对矢量
             数据的多尺度信息、名称信息、数据编码、属性信息等特征信息进行自然语言预

             处理、坐标读取、特征向量构建等操作处理的同时,兼顾对坐标系、坐标数据、
             空间拓扑关系等进行转换。
                 各种结构的矢量信息处理方法类似,其提取方式则根据结构的不同而有所区
             别:oGC 标准服务的 GML 结构矢量数据:通过 OGC 服务的接口获取 GML 矢

             量数据,并利用 OGC 标准的 GML 识别器对矢量数据结构进行解析,读取相应
             的名称、空间特征及属性等信息;KML/KMZ 等格式的地理标准的矢量数据:由

             于 KML 使用是基于标签的结构,含有嵌套的元素和属性,并符合 XML 标准,
             因此可以利用 KML 解析器对 KML/KMZ 结构的矢量数据格式进行解析,方便快
             捷地读取信息的要素、几何图形、方向、位置、规模、区域等结构信息。


                                                                                    273
   280   281   282   283   284   285   286   287   288   289   290