Page 158 - 计算机应用软件开发技术研究
P. 158

计算机应用软件开发技术研究
            Research on Computer Application Software Development Technology

            速发展,这时用户获得了更方便灵活的数据存取语言和界面;此外,在线事务处
            理手段的出现也极大地推动了关系数据库技术的应用普及,尤其是在大数据量存
            储、检索和管理的实际应用领域。

                自 20 世纪 80 年代中期开始,关系数据库技术被普遍采用,新一轮研究与开
            发新型与强大的数据库系统悄然兴起,并提出了许多先进的数据模型:扩展关系
            模型、面向对象模型、演绎模型等;以及应用数据库系统:空间数据库、时序数
            据库、多媒体数据库等;异构数据库系统和基于互联网的全球信息系统也开始出

            现并在信息工业中开始扮演重要角色。目前,数据库界除了关注万维网数据库、
            分布式数据库、面向对象数据库、多媒体数据库、查询优化和并行计算等技术
            外,已经在开始反思,数据库最实质的应用仅仅是查询吗?理论根基最深的关系
            数据库最本质的技术进步点,就是数据存放和数据使用之间的相互分离。然而,

            人们越来越清楚地发现“查询是数据库的奴隶,发现才是数据库的主人”。
                被收集并存储在众多数据库中且正在快速增长的庞大数据,已远远超过人
            类的处理和分析理解能力(在不借助功能强大的工具情况下),这样存储在数据
            库中的数据就成为“数据坟墓”,即这些数据极少被访问,结果许多重要的决策

            不是基于这些基础数据而是依赖决策者的直觉而制定的,其中的原因很简单,这
            些决策的制定者没有合适的工具帮助其从数据中提取出所需的信息知识。而数据
            挖掘工具可以帮助从大量数据中发现所存在的特定模式规律,从而可以为商业活
            动、科学探索和医学研究等诸多领域提供所必需的信息知识。数据与信息知识之

            间的巨大差距迫切需要系统地开发数据挖掘工具,来帮助实现将“数据坟墓”中
            的数据转化为知识财富。
                (三)数据挖掘的对象
                从原则上讲,数据挖掘可以在任何类型的信息存储上进行,可以是结构化的

            数据源,也可以是半结构化的,还可以是高级数据库系统和面向特殊应用的数据
            库。结构化的数据源包括关系数据库、数据仓库、事务数据库等;半结构化的数
            据源包括文本数据库等;高级数据库系统包括面向对象和对象一关系数据库;面
            向特殊应用的数据库系统包括空间数据库、时间序列数据库、多媒体数据库以及

            Web 数据库。在这些数据源中,由于关系数据库应用广泛,具有统一的组织结
            构,规范通用的查询语言,目前仍然是数据挖掘的主要对象。





            ·146·
   153   154   155   156   157   158   159   160   161   162   163