Page 106 - 计算机应用软件开发技术研究
P. 106

计算机应用软件开发技术研究
            Research on Computer Application Software Development Technology

            时间去调用若干个 classify 程序,从而去分担同一个 IP 下爬取数据的压力。采集
            到的数据经过移动用户日志处理程序处理后,一般有标签、网站、内容、关键字
            匹配、号码、耗时、流量等输出内容。结果统计入库程序:每天都要从前一天的
            GPRS_LOG 日志生成文件开始处理。可以在 HDFS 上保存 label 程序,并到 hive

            库中把处理结果的文件导入进来。该程序是将 hive 下的 script 目录中的任务扫
            描,一般每过 10 分钟就要扫描一次,并将所有的统计任务从系统中读出。同时
            要判断每个任务中的前置任务的数据是否生成了,是否存在本任务结果的分区。

            如果都生成了,也存在分区,就可以把任务提交到的任务队列中。
                在如今大数据的背景下,提出对移动互联网的用户行为的一种综合分析的方
            法,设计一个有效的移动用户行为分析方案,其意义是重大的,因为可以帮助移
            动运营商拓展移动互联网的业务。本书研究工作主要针对网络移动用户,研究了

            移动用户行为的特点、移动用户行为分析的内容和方法及数据挖掘算法的选择,
            结合 Hadoop、Hive 及 ZooKeeper 等大数据技术,详细地对数据分析层各模块进
            行了设计,深入地研究了移动用户行为分析系统的构建方法。在选取的用户数据
            规模不是太庞大,如果数据规模越大,则生成的知识或规则就越完善,本书只对

            网络用户行为进行了分析,这是本书不足的地方。在以后的工作中需要对网络用
            户行为进一步进行预测分析,研究网络用户行为分析预测方法以及行为分析系统
            的应用等。



                  第三节  面向数据的软件工程方法探讨及初步应用


                数据在软件研发及应用过程中占据主要地位,尤其是在软件的结构和功能的

            正常表现中呈现必要特征。伴随着社会形态逐渐向数字技术化转变,人们对数据
            在实际应用中的信息安全及综合方面的呈现提出了严格要求。同时,软件的发展
            过程经历了很长时间,研发者在软件设计过程中不断积累经验并对工程体系的构
            建逐渐完善。在软件研发过程中注重将服务体系革新转变为数据革新,从而使软
            件结构和功能的构建更加符合社会变化产生的新需求。










            ·94·
   101   102   103   104   105   106   107   108   109   110   111