Page 103 - 计算机应用软件开发技术研究
P. 103

第三章  软件工程与大数据研究



             并统一管理,因此研究移动用户行为的特征必须使用到数据挖掘技术。可以通过
             查看移动用户上网的日志记录,来描述用户上网行为的特征,并给这类用户总结
             他们的主要属性。要给用户的行为模式进行分类必须根据用户的行为表现特征来

             分类。从采集到的数据去分析,并归纳用户的各种行为特征,从用户行为特征中
             统计出它的规律性,从而创建用户的行为模型。将用户的行为模式的内容和规律
             进行总结归纳。对大数据环境下移动用户上网行为特征的分析,就必须使用数据
             挖掘。

                 2.移动互联网用户行为分析的方法
                 在对用户行为特征进行分析的过程中,应用数据挖掘的流程:
                 第一,首先根据企业的发展战略规划和企业目前发展的阶段,准确理解商业
             中存在的问题,选定挖掘数据的目标,有目的地设计营销策略,确定研究的内容

             及研究方法;
                 第二,根据所收集到的数据,构建用户的行为模型;
                 第三,将数据经过选取、清理、转换、整合以及变量的约简过程,最终生成
             所要的数据;

                 第四,围绕数据挖掘的目标,选择合适的挖掘算法;
                 第五,将生成的数据导入模型中,去验证用户的行为模型是不是准确和有效
             的,需要通过数据挖掘技术来验证;
                 第六,如果模型没有通过验证,就需要重新创建用户行为模型,通过了验证

             则该用户行为模型就可用于数据分析的运营;
                 第七,用户行为模型结果最终以文字或图表来展示,这是数据挖掘完之后完
             成的转换;
                 第八,数据挖掘模型在使用过程中得到不断地调整和完善。

                 3.聚类算法的选择
                 首先,统计量。本部分内容主要针对移动用户的行为数据来创建的移动用户
             行为模型,通过数据挖掘技术去发现移动用户的行为特征,因此需要选取欧式距
             离作为统计量。其次,聚类方式的选择综合考虑本书选择的算法是 k-means 聚类

             算法。因为大数据环境下移动用户行为数据比较庞大,对于企业的数据进行分析
             时,必须考虑采用能够得到比较准确的分类结果、一个相对时间短的计算和能对
             庞大数据进行分类的聚类方法。最后,需要有一个判断准则来判断什么是合理的



                                                                                  ·91·
   98   99   100   101   102   103   104   105   106   107   108