Page 178 - 大数据技术及安全研究
P. 178
大数据技术及安全研究
Big Data Technology and Security Research
将两个父代个体的部分结构进行替换、重组,进而形成新个体的过程,这是遗传
算法的核心部分。⑤变异运算:就是对于种群中的个体的某些基因进行突变。⑥
终止条件包括两种:一种是达到了所需要的预测准确度,另一种情况是达到了最
大的进化代数。近年来,很多人对遗传算法进行了大量的研究,主要应用于组合
优化、机器智能学习、人工生命、自适应的控制和信号处理等领域。在股价预测
领域里最常用的方法便是神经网络和遗传算法的结合,因为股票价格是一个非线
性、高复杂性的混沌模型。但是在短期内,股票价格也是具有一定规律和拟随机
性的,因此,可以利用短期数据结合遗传算法对股价进行预测。具体实现时多为
使用 MATLAB 实现,还有少量使用 JAVA、C++。研究点实为对于遗传算法的改
进,即大多数主要是利用 BP 网络、动态神经网络等算法对于种群内最优父代的
选择和其他诸如:遗传代数、种群数和自适应性等问题的研究。
(二)遗传算法在大数据预测的应用
1. 快速遗传算法(GP-QUICK)应用到大数据预测的设计
该代码是符合美国国家标准协会的 C++ 代码,但是我们会遇到一些可移植
性方面的问题,也就说该代码有可能不适合毕业设计所需要。它最原始的编译者
是来自宝蓝软件公司的在 DOS 和微软窗口下的 16bit 的 C++ 程序。该算法包含
如下几个源文件:Chorme.h、Chorme.cpp、Primitiv.h、Primitiv.cpp、Selector.h、
Selector.cpp、Pch.h、Ssprob.cpp 和 Antprob.cpp。他们的功能依次是关键主体定
义和 GP 基因的定义、标准 GP 算法原始功能定义、遗传算法适应度选择定义、
一个包含数据定义的预编译头文件和一个由用户控制和更改的主程序。但是,仅
仅使用所提供的功能达不到实验设计所需。下面将介绍该算法的工作原理和设计
部分。快速遗传算法工作原理快速遗传(GP - QUICK)使用的是标准的 GA 算法。
该算法每隔 5s 或者 1000 个式子评估之后,它将把最佳的式子结果输出,它是一
个选择竞争的过程,它通过一个容量为 6 的竞争种群,然后通过竞争,淘汰掉其
中的 2 个。遗传过程包括 3 种类型的突变:包括固定变异、收缩变异和交叉互换
遗传因子变异,他们的变异率都是 10%。通过使用交叉变异,即把两个遗传因子
的相同参数部分互换;第二种变异是固定变异方式,它是通过微小的调整去达到
满意的数值;第三种变异是收缩变异,促使一个子子树替换子树。除了以上的变异,
对于新的方案算法还会采用一个概率为 10% 的重评估,子树的交叉互换概率为
70%,种群数量定为 2000。快速遗传算法还支持使用交叉互换和变异两种方式,
·166·

