Page 284 - 测绘新技术的理论与实践研究
P. 284
测绘新技术的理论与实践研究
三、互联网泛在地理信息分类评价因子与分类谱系
采用数据格式、结构特征、嵌入模式、上下文环境、行为能力等属性作为顶
层分类评价因子,建立层次化的分类评价因子体系,以此作为描述地理信息类别
特征的参数群,并明确各评价因子的分类编码与影响因子;在此基础上,将目前
常用的互联网地理信息划分为静态地图、动态地图、地名对象、地址短语、兴趣
点(集)、KML/KMZ、OGC 数据服务等类型,按照其存在或表达形态,可概括
为可视化地理信息、标准化在线服务和非标准化在线服务三大类,针对上述特征
参数群开展特征研究,并进一步明确各类地理信息的分类编码。
其详细描述如下:
(一)可视化地理信息
主要是指以文本、图像、视频等可视化网页元素进行表达的地理信息,主要
包括交互式地图控件、静态地图、地名地址、地理标记媒体(如视频、图片等)。
(二)标准化在线服务
主要是指以非 HTML 元素表达的、符合国际标准规范的地理信息服务,主
要包括 WMS/WFS/WCS/TMS 等 OGC 在线数据服务、GeoRSS 等。这些服务通
常采用 XML 进行描述,在网页中通常以超链接作为内容入口。
(三)非标准化在线服务
通常以 XML、TXT、JSON 等形式进行描述、如在线地理编码服务、行业 /
领域地理数据服务、主流系统/软件在线服务,此类地理数据服务的结构千差万别,
无法用统一的解析引擎进行内容分析,因此在本课题中通过建立结构识别适配器
和内容提取适配器,来实现类型识别和信息抽取。
四、互联网泛在地理信息判别知识库构建与更新
互联网泛在地理信息判别知识库由分类样本库、分类谱系库、分类因子库、
类型识别模型库和评价决策树等五类数据构成,在领域专家、业务人员的参与下,
每类数据的数据内容均可以进行动态更新。
五、互联网泛在地理信息判别处理过程
互联网泛在地理信息判别主要包括以下三个方面的处理:
(一)互联网地理信息类别匹配与结构探测
在互联网泛在地理信息知识表达模型的基础上,建立基于数据格式、数据结
272

