Page 103 - 计算机应用软件开发技术研究
P. 103
第三章 软件工程与大数据研究
并统一管理,因此研究移动用户行为的特征必须使用到数据挖掘技术。可以通过
查看移动用户上网的日志记录,来描述用户上网行为的特征,并给这类用户总结
他们的主要属性。要给用户的行为模式进行分类必须根据用户的行为表现特征来
分类。从采集到的数据去分析,并归纳用户的各种行为特征,从用户行为特征中
统计出它的规律性,从而创建用户的行为模型。将用户的行为模式的内容和规律
进行总结归纳。对大数据环境下移动用户上网行为特征的分析,就必须使用数据
挖掘。
2.移动互联网用户行为分析的方法
在对用户行为特征进行分析的过程中,应用数据挖掘的流程:
第一,首先根据企业的发展战略规划和企业目前发展的阶段,准确理解商业
中存在的问题,选定挖掘数据的目标,有目的地设计营销策略,确定研究的内容
及研究方法;
第二,根据所收集到的数据,构建用户的行为模型;
第三,将数据经过选取、清理、转换、整合以及变量的约简过程,最终生成
所要的数据;
第四,围绕数据挖掘的目标,选择合适的挖掘算法;
第五,将生成的数据导入模型中,去验证用户的行为模型是不是准确和有效
的,需要通过数据挖掘技术来验证;
第六,如果模型没有通过验证,就需要重新创建用户行为模型,通过了验证
则该用户行为模型就可用于数据分析的运营;
第七,用户行为模型结果最终以文字或图表来展示,这是数据挖掘完之后完
成的转换;
第八,数据挖掘模型在使用过程中得到不断地调整和完善。
3.聚类算法的选择
首先,统计量。本部分内容主要针对移动用户的行为数据来创建的移动用户
行为模型,通过数据挖掘技术去发现移动用户的行为特征,因此需要选取欧式距
离作为统计量。其次,聚类方式的选择综合考虑本书选择的算法是 k-means 聚类
算法。因为大数据环境下移动用户行为数据比较庞大,对于企业的数据进行分析
时,必须考虑采用能够得到比较准确的分类结果、一个相对时间短的计算和能对
庞大数据进行分类的聚类方法。最后,需要有一个判断准则来判断什么是合理的
·91·

