Page 163 - 计算机应用软件开发技术研究
P. 163

第五章  基于数据挖掘技术的智能信息处理



             发生在数据挖掘的各个不同阶段,从不同角度或不同粒度进行交互。所以良好的
             交互式挖掘(lnieraction Mining)也是数据挖掘系统成功的前提。
                 (五)数据挖掘语言与系统的可视化问题
                 对 OLTP(Online Transaetion Processing)应用来说,结构化查询语言 SQL

             已经得到充分发展,并成为支持数据库应用的重要基石。但是,对于数据挖掘技
             术而言,由于诞生得较晚,加之它相比 OLTP 应用的复杂性,开发相应的数据挖
             掘操作语言仍然是一件极富挑战性的工作。可视化要求已经成为目前信息处理系

             统的必不可少技术。对于一个数据挖掘系统来说,它显得更为重要。可视化挖掘
             除了要和良好的交互式技术结合外,还必须在挖掘结果或知识模式的可视化、挖
             掘过程的可视化以及可视化指导用户挖掘等方面进行探索和实践。
                 (六)互联网上知识的发现

                 WWW 正日益普及,从中可以找到很多新的知识,已有一些资源发现工具来
             发现含有关键字的文本。加拿大的 Han 等人提出利用多层次结构化的方法,通
             过对原始数据的一般化,构造出多层次的数据库。例如可将 WWW 上的图像描
             述而不是图像本身存储在高层数据库中,现在的问题是如何从复杂的数据(如多

             媒体数据)中提取有用的信息。对多层数据库的维护以及如何处理数据的异类性
             和自主性等。


                                    第二节  关联规则挖掘



                 关联规则挖掘是数据挖掘领域中重要的研究方法之一,广泛应用于医学、
             金融、互联网等多个领域。最初的关联规则挖掘是针对购物篮分析问题提出的,

             其目的在于发现交易数据库中不同商品之间的关联关系,获得有关顾客购买模式
             的一般性规则。通过这些规则可以指导商家合理地安排进货、库存及货架设计。
             Agrawal 等人提出了最早的基于频繁项集的经典关联规则 Apriori 算法;之后,中
             国和其他国家研究人员都对关联规则挖掘问题进行了深入研究。相关工作包括对
             基于 Apriori 算法的优化、并行关联规则挖掘、数量关联规则挖掘以及关联规则

             挖掘理论的探索等。







                                                                                 ·151·
   158   159   160   161   162   163   164   165   166   167   168