Page 157 - 计算机应用软件开发技术研究
P. 157

第五章  基于数据挖掘技术的智能信息处理








                第五章  基于数据挖掘技术的智能信息处理


                                    第一节  数据挖掘理论



                 一、数据挖掘及有关概念

                 (一)数据挖掘的概念
                 数据挖掘(Data Mining)是指从大型数据库或数据仓库中存储的大量的、不

             完全的、有噪声的数据中,发现隐含在其中的、人们事先不知道的、但又是潜在
             有用的信息和知识的过程。提取的知识一般可以表示为概念、规则、规律、模式
             等形式。数据挖掘所研究的知识发现,不是要求发现放之四海皆准的知识,也不
             是要去发现全新的科学定律。实际上,它所发现的知识都是相对的,都具有特定
             前提和约束条件的。它必须面向特定的应用领域,同时发现的知识还要易于被用

             户所理解。
                 (二)数据挖掘的产生
                 随着计算机硬件和软件的飞速发展,尤其是数据库技术与应用的日益普及,

             人们面临着快速扩张的数据海洋,如何有效利用这一丰富数据海洋的宝藏为人类
             服务,业已成为广大信息技术工作者所重点关注的焦点之一。与日趋成熟的数据
             管理技术和软件工具相比,人们所依赖的数据分析工具功能,却无法有效地为决
             策者提供其决策支持所需要的相关知识,从而形成了一种独特的现象——“丰富
             的数据,贫乏的知识”。为有效解决这一问题,自 20 世纪 80 年代开始,数据挖

             掘技术逐步发展起来,数据挖掘技术的迅速发展,得益于目前全世界所拥有的巨
             大数据资源以及对将这些数据资源转换为信息和知识资源的巨大需求,对信息和
             知识的需求来自各行各业,从商业管理、生产控制、市场分析到工程设计、科学

             探索等。数据挖掘可以视为是数据管理与分析技术的自然进化产物。
                 自 20 世纪 60 年代开始,数据库及信息技术就逐步从基本的文件处理系统
             发展为更复杂功能、更强大的数据库系统;20 世纪70 年代的数据库系统的研究
             与发展,最终导致了关系数据库系统、数据建模工具、索引与数据组织技术的迅




                                                                                 ·145·
   152   153   154   155   156   157   158   159   160   161   162