Page 207 - “互联网+”背景下政务工作信息化研究与探索
P. 207

第八章  基于云计算的电子政务信息管理


             据,在进行云计算的分布式采集时,应按照数据的不同类型,分类存储。同时也

             因为云计算具有很强的扩展性和容错能力,可将数据池相同或者相似的数据同构
             化,同时应用集群技术、虚拟化技术实现机构之间的无缝对接和超级共享。
                 2.电子政务信息大数据的存储
                 电子政务数据仓库是面向主题的、集成的、相对稳定的、反映历史变化的数

             据集合,用于支持政府管理中的决策服务。电子政务数据仓库与过去的电子政务
             数据库存储最大的区别在于,前者以数据分析、决策支持为目的来组织存储数
             据,后者主要目的则是运营型系统保存、查询数据。

                 同时由于大数据本身的特点,传统的电子政务数据仓库也已经无法适应大数
             据的存储需求。首先,大数据的急骤增长,使得传统数据仓库技术面临巨大的挑
             战,单结点的数据仓库系统往往难以存储和分析海量的数据。其次,传统的行
             式数据仓库,是根据元组按行存储的,维护大量的索引和物化视图无论是在时间

             (处理)还是空间(存储)方面成本都很高。
                 而基于云计算的电子政务数据仓库采用列式存储克服了行式存储的弱点。列
             式数据仓库的数据是根据属性按照列存储,每一属性列单独存放。投影数据时只

             访问查询涉及的属性列,大大降低了系统输入和输出损耗。又由于列式存储的
             数据具有相同的数据类型,相邻存储的数据之间相似性比较高,具有更好的压缩
             率,而压缩的数据更能够减少输入与输出的开销。例如,传统的数据仓库存储采

             用的形式存储有一个1万行的表,取其中3个字段,行存储需要每行都读取出来
             才能取出3个字段。而列存储只需要读3次就可以完成任务。尤其在大数据环境
             下,将大幅度提高电子政务数据仓库管理的性能。

                 3.电子政务信息大数据的联机分析
                 联机分析处理是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策
             支持,并且提供直观易懂的查询结果。在联机分析当中,云计算的分布式并行计
             算从数据仓库中的综合数据出发,提供面向分析的多维模型,并使用多维分析的

             方法从多个角度、多个层次对多维数据进行分析,使决策者能够更全面地分析数
             据。联机分析处理的一个主要特点是多维数据分析,这与数据仓库的多维数据组
             织正好形成相互结合、相互补充的关系。因此,利用联机分析处理技术与数据仓

             库的结合可以较好地解决电子政务决策支持系统既需要处理海量数据又需要进行
             大量数值计算的问题。


                                                                                    195
   202   203   204   205   206   207   208   209   210   211   212