Page 179 - 大数据技术及安全研究
P. 179
第五章 数据预测与数据安全处理研究
通过这种方式可以替代一个父代用来替代通过繁殖达到一个正确的数值。通过这
种方式,可以使很小的种群变为很大,从而减少过小的收敛。
2. 基于快速遗传算法的设计
最常见的方式就是遗传算法和神经网络的组合模式,遗传算法可以在广阔
的股价历史数据中进行探索,以求得最佳普遍适应性;而神经网络可以在小范围
的种群内进行最优化的选择。但是首先神经网络我了解不多;其次是神经网络的
引入能否帮助遗传算法提高预测值的准确度是一个未知数,当两种算法结合到
一起的时候会不会带来收敛上的问题;最后是神经网络的引用,对于计算的复杂
度有很大的压力。所以,我决定,先按部就班,把熟悉的做好,如果只使用 GP-
QUICK 就能达到一个之前看到论文中实验结果普遍层面的精度的话,然后再通
过调整参数去改进精度。所以,想法是先将运用快速遗传算法(GP-QUICK)的
预测结果实验出来,再根据实验结果的好坏进行改进,再决定是否使用神经网络。
3. 快速遗传算法在大数据预测时的实现
由多次随机测试,都可以得出一个绝对误差平均值为 1%~1.5% 之间的数据。
我们可以看到这个数据的准确度在实际中还是可以接受的。再回看之前的其他人
用不同方法做的股票价格预测方法,在结果上看,结果是比较优秀的。
第二节 基于大数据分析技术的建模预测
一、大数据环境下的网络流量非线性预测建模
(一)大数据环境下的网络流量非线性预测原理
大数据环境下的网络流量非线性预测原理为:首先采集大规模的网络流量历
史数据,然后根据云计算技术的 Map/Reduce 处理模式对其进行细分,得到多个
数据量相对较小的子训练样本集合,并引入数据挖掘技术中的状态回声网络对子
训练样本集合的网络流量进行预测,最后对子训练样本集合的网络流量预测结果
进行融合,输出网络流量的最终预测结果。
(二)大数据环境下的网络流量非线性预测步骤
①对于一个网络管理系统中的服务器历史数据进行收集。
·167·

