Page 167 - 计算机应用软件开发技术研究
P. 167
第五章 基于数据挖掘技术的智能信息处理
入侵检测模型(CVNIDM),将攻击发生的外部条件考虑进去以对 IDS 告警信
息加以区分,从而提高 IDS 告警的准确性。提出了一种计算相邻告警的综合相关
置信度(h-置信度)关联规则算法,有效地发现低支持度—高置信度的告警关联
规则。
隐私保护数据挖掘是指在数据挖掘的过程中通过采用数据干扰和查询限制的
基本策略对原始数据进行保护,避免商业敏感数据、个人隐私数据泄露。提出一
种基于数据干扰和分布重构思想的隐私保护关联规则算法 EMASK。BE-MASK
算法基于粒度计算的思想对 EMASK 算法进行改进,利用粒度方式将关系数据表
转换为面向机器的关系模型,进而将计算频繁项集转换为计算基本颗粒的交集,
同时采用数据垂直表示,相对于 EMASK 算法减少了 I/O 操作次数。文献提出一
种满足均匀分布的不确定数据关联规则算法 UFI-DM,有效解决了传统数据挖掘
技术应用于隐私保护问题中不确定因素时效率低下或不可行的问题。
利用关联规则进行蛋白质结构预测,根据蛋白质序列的特点可以对这些序
列数据进行量化和处理,再将关联规则算法用于序列数据集上寻找蛋白质序列
中的关联关系。基于内在认知机理知识发现(KDTICM)和数据库中的知识发现
(KDD)模型,提出一种基于关联分类的蛋白质二级结构预测方法 SAC,该算
法以 85% 的准确率成功预测了蛋白质序列。随着遥感导航定位、地球物理等卫
星数量的增加,空间地球大数据为地球科学研究带来新机遇。传统数据分析方法
以统计分析、非线性拟合为主,其在处理多维、海量数据时存在明显不足。基于
关联规则的挖掘模式可以揭示海洋、陆地、大气等地球数据之间的关系,从而推
动全球变化、灾害科学领域的发展。采用多重约束进行时序关联规则挖掘,分析
得到了与实际情况高度吻合的气候指数与陆地区域异常降水事件间的关系。
·155·

