Page 174 - 计算机应用软件开发技术研究
P. 174

计算机应用软件开发技术研究
            Research on Computer Application Software Development Technology

            的矩形单元,这些单元形成了一个层次结构:高层的每个单元被划分成多个低一
            层的单元。每个网格单元的属性都被预先计算好。对于一个对象,首先在最高层
            次决定它属于哪个矩形单元,确定以后再在该单元的子单元中寻找对象的所属单

            元,直到在最底层找到对象属于哪个单元。
                2.waveCluster(采用小波变换聚类)
                小波变换聚类方法首先通过在数据空间上强加一个多维网格结构来汇总数
            据,然后采用一种小波变换来变换原特征空间,在变换后的空间中找到密集区

            域。使用小波变换,是因为它有如下优点:
                第一,它提供了无指导聚类。因为它采用帽型过滤,自动过滤掉区域外的较
            弱信息;第二,小波变换得多分辨率特性对不同精确性层次的聚类探测是有帮助
            的;第三,基于小波的聚类速度很快,计算复杂度是 O(n);第四,CLIQUE

            (Clustering In QUEst)聚类高维空间:CLIQUE 聚类算法综合了基于网格和密度
            的聚类方法。它的主要思想为:给定一个多维数据点的大集合,数据点在数据空
            间中通常不是均匀分布的。如果一个单元中的包含数据点超过了某个输入模型参
            数,则该单元是密集的。

                CLIQUE 聚类算法的步骤是:
                第一,CLIQUE 将 n 维数据空间划分为互不相交的长方形单元,识别其中的
            密集单元。该工作对每一维都要进行;第二,CLIQUE 为每个簇生成最小化的描
            述。对每个簇,它确定覆盖相连的密集单元的最大区域,然后确定最小的覆盖

                (五)基于模型的聚类方法
                基于模型的聚类方法试图优化给定的数据和某些数学模型之间的适应性。这
            类方法基于这样的假设:数据是根据潜在的概率分布生成的。基于模型的聚类方
            法主要有两类:统计学方法、神经网络方法。

                1.统计学方法
                概念聚类是一种基于统计学的聚类方法,一般用于机器学习。给出一组未标
            记的对象,它产生对象的一个分类模式,并且对每组分类还给出描述,即每组对
            象代表一个概念。

                XOBWEB 是一种具体的概念聚类算法,它的输入对象用分类属性一值对来
            描述,以一个分类树的形式创建层次聚类。分类树中的每个节点对应一个概念,
            且节点含有概率描述。分类树的某个层次上的兄弟节点对对象全体形成了一个划



            ·162·
   169   170   171   172   173   174   175   176   177   178   179