Page 208 - “互联网+”背景下政务工作信息化研究与探索
P. 208
“互联网 +”背景下政务工作信息化研究与探索
Research and Exploration on Informatization of Government Affairs under the Background of “Internet +”
4.电子政务信息大数据的挖掘
利用电子政务联机分析方法一般只能获得数据的表层信息,难于揭示数据属
性的内在关系和隐含信息。电子政务信息大数据挖掘是指从海量数据的大型数据
仓库中提取人们感兴趣的隐性的知识,这些知识是事先未知且是潜在的。提取出
来的知识通常可以表示为概念、规则、规律或模式等形式。
基于云计算的电子政务信息大数据挖掘采用分布式并行挖掘技术。分布式并
行数据挖掘技术不同于其他并行算法的地方在于它适用于处理大规模的数据处
理。过去所使用的串行数据挖掘算法只能适用于规模很小的数据,并且其运行需
要花费大量的时间也成为其缺点。分布式并行数据挖掘是指在分布式系统中,机
器集群看作硬件数据池,将并行的任务拆分,然后交由每一个空闲机器去处理
数据,能够极大地提高计算效率,同时这种数据无关性,对于计算集群的扩展无
疑提供了最好的设计保证。任务分解处理以后,将处理以后的结果再汇总起来。
MapReduce是云计算环境中处理大规模数据集的挖掘模型,程序员在Map(映
射)函数中指定对各分块数据的处理过程,在Reduce(规约)函数中指定如何对
分块数据处理的中间结果进行归约。在电子政务信息大数据中的应用,不仅可以
提高数据挖掘的效率,而且这种机器数据的无关性对于计算集群的扩展也提供了
最好的设计保证。
5.电子政务信息大数据的可视化
①反映同类事物共同性质的广义型知识。②反映事物各方面特征的特征型知
识。③反映不同事物之间属性差别的差异型知识。④反映一事物和其他事物之间
依赖或关联的关联型知识。⑤根据历史和当前数据推测未来数据的预测型知识。
⑥揭示事物偏离常规出现异常现象的偏离型知识。但如何能更好地揭示这些蕴藏
在政府领域中的海量知识之间的关系和发展趋势,则需要在数据挖掘的过程中应
用可视化技术为政府决策和管理服务。数据可视化是对大型数据库或数据仓库中
的数据的可视化,它是可视化技术在非空间数据领域的应用,使人们不再局限于
通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构
关系。具体而言是将大型数据集中的数据以图形、图像形式表示,并利用数据分
析和开发工具发现其中未知信息的处理过程。数据可视化是电子政务信息大数据
管理过程中重要的技术。在云环境中,电子政务信息大数据可视化不仅用图像来
显示多维的非空间数据,使用户加深对数据含义的理解,而且用形象直观的图像
196

