Page 166 - 计算机应用软件开发技术研究
P. 166
计算机应用软件开发技术研究
Research on Computer Application Software Development Technology
构相结合,只进行一次深度优先遍历 FP-tree 产生候选概念格节点,并通过约束
条件构造约束概念格,有效解决了重复扫描 FP-tree 以及构造概念格中存在冗余
节点的问题。以上算法避免了 Apriori 类约束算法在高密度数据集出现的候选集
爆炸问题。
(二)系统客观层面
关联规则挖掘的质量在客观层面上取决于评估模式质量的标准,它使用从数
据中推导出的统计量来判定规则是否有趣,具有客观性、可靠性。支持度—可信
度框架是现有关联规则最常用的衡量指标,但实际应用中,仅使用这两者无法排
除一些用户不感兴趣的规则,甚至会生成误导性规则。为了解决这一矛盾,后续
研究人员提出了其他的度量方法:文献引入了兴趣度规则(R-interesting)的定
义;文献提出使用模板(template)匹配概念确定规则是否有趣;Brin 等人考虑
的蕴涵规则(implicationrule);文献将差异思想引入兴趣度,修改后的算法有
效去除了规则中的反例;文献设计了基于可信度和支持度方差的兴趣度 interestR
重新定义了关联规则形式。
三、关联规则应用
关联分类算法是继贝叶斯(Bayes)、支持向量机(SVM)等机器学习方法
之后的又一重要分类技术,广泛应用于文本分类、Web 文档分类、医学图像分
类。经典的关联分类算法有 CBA、CMAR、CPAR。将关联分类应用于文本分
类,并针对传统关联分类算法依赖经验值设置支持度和置信度阈值引起的分类效
果低下问题,提出一种基于模拟退火技术的支持度和置信度智能优化关联分类算
法。提出一种基于类别相似度聚合的关联文本分类精度高的方法。医学图像在医
学诊断中有重要的辅助作用,医学图像数据挖掘不同于一般数据挖掘,其要求挖
掘具有稳定性、高效性、可靠性。提出一种适合挖掘医学图像数据的 CARMI 关
联分类算法,通过引入双支持度减少图像数据密集、支持度高等特性造成的分类
干扰,实现图像数据的高效分类。
网络入侵检测技术作为防火墙技术强有力的助手,有效弥补了防火墙策略处
理黑客攻击、信息窃取问题时出现的不足,成为网络安全监控系统可靠的保障。
传统的入侵检测系统(IDS)运用关联规则生成入侵检测标准规则库,通过判断
网络数据与规则库的匹配度产生告警数据流。提出了一种基于上下文验证的网络
·154·

