Page 288 - 测绘新技术的理论与实践研究
P. 288

测绘新技术的理论与实践研究

            率和覆盖率的同时减小了研发周期和普适性,而且符合主流搜索引擎与地理信息

            等个性服务不断集成融合的趋势,并能够与其保持良好的信息同步和历史追溯。
                (一)元搜索引擎架构
                元搜索引擎设计与实现以 Microsoft Visual Studio 开发环境为基础。其中,
            主要包括元搜索引擎框架 Meta Search Engine(元搜索引擎)、Request Task

            Manager(查询任务管理器)、SEURL Builder(搜索引擎 URL 构造器)、URL
            Dispatcher(URL 请求分发器)、URL Request Pool Manager(URL 池管理器)、

            Web Request Agent(Web 请求代理)、SEPage Parser(搜索引擎页面解析器)等
            核心类。
                各核心类的具体功能描述如下:
                1.Meta Search Engine

                元搜索引擎框架的最高层类,是元搜索框架的运行入口,负责接收用户提交
            的查询请求,并启动搜索任务。主要功能函数包括启动任务(支持多线程)、结
            束任务、中断并取消任务、获取活动任务列表、获取指定任务的活动状态、设置

            任务池最大容量等。
                2.RequestTaskManager
                管理一个搜索任务的最小单元(相当于 ASP.Net 编程中的 Page 对象),含
            有对 URLDispatcher、WebRequestAgentS 和 SEPageParser 的引用,其核心功能

            是包括:①接收并验证客户端提交的查询请求参数;②构造 URL 请求,并将其
            压入 URLDispatcher 的请求队列池中;③调用 WebRequestAgent,向指定的搜索
            引擎发送请求 URL 并对响应进行跟踪;在收到消息响应后,调用 SEPageParser

            类进行页面内容解析,并在函数 onResponseReceived 中将解析出的数据反馈给
            MetaSearchEngine。
                3.SEURLBuilder
                这是一个抽象类,也是所有搜索引擎 URL 地质构造器的基类,所有特定搜

            索引擎的 URL 地址构造器类均从该类继承得到 .SEURLBuilder 组件的核心扩展
            函数是 getURL(),该函数为虚函数,必须被派生类实现,对应于特定的搜索

            引擎(如百度、谷歌);getURL 函数接收三个参数,即过滤条件、每页记录条
            数、当前页码等,输出对应于特定搜索引擎的查询 URL.SEURLBuilder 作为工
            具类组件,只被 URL Request Pool Manager(URL 池管理器)直接调用,本框


            276
   283   284   285   286   287   288   289   290   291   292   293