Page 212 - 计算机技术与网络安全研究
P. 212

计算机技术与网络安全研究
             Computer Technology and Cyber Security Research



                 一、数据挖掘技术的方法

                 数据挖掘是基于大数据技术而生成的新兴技术手段,能够从大量、复杂、
            不规则、随机及模糊的数据中,将对生产发展有价值的重要数据提取出来。从

            某种层面来说,数据挖掘是一种从庞大数据库中抽取、转换、分析规律的技术
            手段,能够为商业决策等提供准确且有价值的参考,对于提升商业发展潜力有
            积极的作用。
                 聚类分析法。聚类分析法是常见的数据挖掘技术之一,它能够将物理意义

            上的、抽象意义上的对象分成不同组别,并将其中具有某种相同特质的对象分成
            同一类别,换言之就是通过寻找相似之处进行对象分类的技术手段。聚类分析法
            不涉及监督控制,因此聚类分析法中的“分类”,实际上存在一定的不确定性,

            它无法对对象的属性进行比对,因此分类的结果往往有一定的随机性。
                 关联分析法。关联分析法指利用数据之间的关联性进行数据挖掘,并对数
            据进行辨别处理,最后将其运用到行业分析中。技术人员通过运用 Apriori 等算
            法对大批量交易数据进行分析以后,可以发现不同商品之间存在的关联规则,而

            市场营销人员则能够以此为基础调整营销策略,通过捆绑销售等方式保证销售量。
                 特征分析法。特征分析法是常用的数据挖掘技术,它能够从数据库中抽取
            数据并且根据这些数据的内容确定关键词,在此基础上以关键词指代整组数据进

            行数据分析。这样一来进行数据分析所需要的时间必然会大幅减少,进而减少技
            术人员的工作量。特征分析法也并非十全十美,其同样存在一些不足之处,比如
            在选定关键词的过程中必然存在误差,关键词本身也不能完全指代所有数据,这

            必然会影响数据挖掘的准确度。

                 二、大数据时代背景下数据挖掘技术的发展

                 数字化发展。大数据时代背景下的数据挖掘技术,具有重要的应用价值,

            而在未来的发展中,其会朝着数字化的方向进一步发展。目前,我国的数字化技
            术已经相对比较成熟,并且开始在很多行业中发挥积极作用,将数字化技术和数
            据挖掘技术相结合,能够提升数据挖掘技术的信息处理能力,使之在面对多元化

            数据形式的过程中仍然能够发挥积极的作用。
                 集成化发展。数据挖掘的过程十分复杂,需要对原始数据进行逐层分析并


             204
             204
   207   208   209   210   211   212   213   214   215   216   217