Page 191 - 大数据技术及安全研究
P. 191
第五章 数据预测与数据安全处理研究
等,是无法用传统查询统计方法来获取的。为了得到这些有用的信息,需要采用
数据挖掘分析技术,自动智能地对大数据分析、探索和挖掘,探寻数据的模式及
特征,寻找数据背后的信息变化和价值,从而最终使用蕴藏在数据中的信息和知
识。数学模型库是针对所有算法的特征,构建的一个通用库,实现了大数据格式
的“数据结构定义”。对算法参数、数学模型库、模型评估体系和挖掘分析的结
果等进行统一管理,提供了数据挖掘分析的入口。根据输入的算法参数,自动调
用挖掘分析所用的算法及其相应的模型等。
数据挖掘算法工具库针对大数据分布式存储管理、分布式计算的特性,统一
匹配各种数据挖掘算法。根据不同行业的业务需求,工具库可配置不同的算法进
行挖掘分析,具备灵活的动态扩展和分布式任务调度机制。工具库中的算法包括
但不限于分类算法引擎、关系网络分析算法引擎和图形算法引擎,算法引擎之间
可根据实际的业务数据分析需求交叉使用。数据挖掘接口封装是屏蔽底层算法的
细节差异,统一向上层提供数据挖掘的处理接口。接口封装在保证了系统功能独
立的同时增加了系统的可扩展性和灵活性,当与之互联的外围系统发生变化时,
只需修改相应接口程序即可。数据挖掘引擎是在总结、抽象数据挖掘行业类型的
基础上,提供预警型、评估型、跟踪型等多种类型的数据挖掘引擎。数据挖掘应
用调度根据电子政务、电子商务的具体业务需求,设计相应的业务模型,具备较
强的态扩展能力。
(五)信息安全大数据应用
随着大数据技术的不断创新和广泛应用,信息安全领域越来越迫切需要依托
大数据处理技术来实现网络攻击的“事前预防”“主动发现”。面向信息安全领
域的大数据分析平台在大数据采集、预处理、分布计算和挖掘分析的基础上,面
向电子政务、电子商务等不同的行业需求提供信息安全保障服务。
·179·

