Page 162 - 计算机应用软件开发技术研究
P. 162
计算机应用软件开发技术研究
Research on Computer Application Software Development Technology
题,并且要和专业知识结合对结果进行解释。
二、数据挖掘的研究工作
数据挖掘的研究工作主要是围绕如下几个方面展开的。
(一)挖掘法的效率和可扩展性
目前,数据库数据量大、维护高。使得数据挖掘的搜索空间增大,发现知识
的盲目性提高。如何充分利用领域的知识,剔除与发现任务无关的数据,有效地
降低问题的维数,设计出高效率的知识发现算法是下一步发展的重点,它包括领
域知识对行业或企业知识挖掘的约束与指导、商业逻辑有机嵌入数据挖掘过程等
关键课题。
(二)数据挖掘理论与算法研究
经过十几年的研究,数据挖掘已经在继承和发展相关基础学科(如模式识
别、机器学习、统计学等)已有成果方面取得了可喜的进步,探索出了许多独具
特色的理论体系。但是,这绝不意味着数据挖掘理论的探索已经结束,恰恰相反
它留给了研究者丰富的理论课题。一方面,在这些大的理论框架下有许多面向实
际应用目标的挖掘理论等待探索和创新。另一方面,随着数据挖掘技术本身和相
关技术的发展,新的挖掘理论的诞生是必然的,而且可能对特定的应用产生推
动作用。新理论的发展必然促进新的挖掘算法的产生,这些算法可能扩展挖掘的
有效性,如针对数据挖掘的某些阶段、某些数据类型、大容量源数据集等更有
效,可能提高挖掘的精度或效率,可能融合特定的应用目标,如 cRM、电子商
务等。因此,对数据挖掘理论和算法的探讨将是长期而艰巨的任务。
(三)数据的时序性
在应用领域的数据库中,数据在不断地更新,随着时间的推移,原先发现知
识的有用性将降低。我们需要随时间逐步修正发现模式来指导新的发现过程。
(四)数据挖掘系统的构架与交互式挖掘技术
虽然经过多年的探索,数据挖掘系统的基本构架和过程已经趋于明朗,但是
受应用领域、挖掘数据类型以及知识表达模式等的影响,在具体的实现机制、技
术路线以及各阶段或部件(如数据清洗、知识形成、模式评估等)的功能定位等
方面仍需细化和深入研究。由于数据挖掘是在大量的数据源集中发现潜在的、事
先并不知道的知识,因此和用户交互式进行探索性挖掘是必然的。这种交互可能
·150·

