Page 280 - 电算化模式与会计档案发展研究
P. 280
电算化模式与会计档案发展研究
Research on Accounting Computerization and Development of Accounting Archives
析、互联网等技术。信息感知技术、信息传输技术、信息安全技术也都与大数据密切
相关。
大数据的处理包括数据采集、数据存取、基础架构、数据处理、统计分析、数据
挖掘、模型预测和结果呈现。数据采集是将分布的、异构数据源中的数据抽取到临时
中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中成为联机分析处
理、数据挖掘的基础;数据存取涉及大规模并行处理数据库、分布式数据库、关系数
据库等;基础架构包括云存储、分布式文件存储等;数据处理涉及人与计算机交互的
语言,关键是要让计算机“理解”人的自然语言;统计分析是采用假设检验、差异分
析、相关分析等方法对数据进行分析;数据挖掘是对数据进行分类、估计、预测、相
关性分组或关联规则、聚类、描述和可视化,而从中提取隐含的、人所不知的、但潜
在有用的信息和知识;模型预测是从大数据中挖掘出特点,通过科学建立模型及以模
型带入新的数据而预测未来的数据;结果呈现是通过云计算、标签云、关系图等将大
数据处理结果显示出来。
• 272 •

