Page 155 - 大数据技术及安全研究
P. 155

第四章  大数据时代演化算法与进化算法的有关分析




              选择何种编码表示有时对算法的性能、效率等产生很大的影响。
                  ②确定适应度函数:适应值是对解的质量的一种度量,它通常依赖于解的行
              为与环境(即种群)的关系。一般以目标函数或费用函数的形式来表示。解的适
              应值是演化过程中进行选择的唯一依据。

                  ③选择策略的确定:优胜劣汰的选择机制使得适应值大的个体有较高的存活
              概率,这是演化算法与一般搜索算法的主要区别之一。不同的选择策略对算法的
              性能也有较大的影响。
                  ④控制参数的选取:控制参数主要包括种群的规模、算法执行的最大代数、

              执行不同遗传操作的概率以及其他一些辅助性的控制参数。
                  ⑤遗传算子的设计:演化算法中的遗传算子,主要包括繁殖、杂交、变异以
              及其他高级操作。
                  ⑥确定算法的终止准则:由于演化计算没有利用目标函数的梯度等信息,所

              以在演化过程中,无法确定个体在解空间的位置,从而无法用传统的方法来判定
              算法的收敛与否以终止算法。常用的办法是预先规定一个最大的演化代数或算法
              在连续多少代以后解的适应值没有什么明显的改进时即终止。
                  ⑦编程上机运行:完成上述工作后,即可按演化计算的算法结构编程,进行

              问题求解。由于演化算法的随机性及不确定性等特点,通常要多运行几次才能得
              到可靠的解。
                  应该注意的是,上述基本步骤密切相关,编码方案与遗传算子的设计等是同
              步考虑的,有时甚至需要上机运行与算法设计交替进行。

                  (二)编码表示
                  设计演化算法的一个重要步骤是,对所解问题的变量进行编码表示,编码表
              示方案的选取在很大程度上依赖于问题的性质及遗传算子的设计。通常,在设计
              演化算法时,只有两个方面与所求问题有关,即问题的编码表示与适应函数的确

              定。根据编码方式的不同,演化算法的编码策略大致可分为二进制编码、实数编
              码、有序串编码与结构性编码等。二进制编码就是将原问题的解空间映射到位串
              空间上,然后在位串空间上进行遗传操作,结果再通过解码过程还原成其表现型,
              以进行适应值的评估。当变量不止一个分量时,我们可以对各分量分别进行编码,

              然后合并成一个长串。解码时,根据其对应的子串分别进行解码即可。采用二进
              制编码时,一般要先给出求解精度以确定串长。而一旦精度确定后,就很难在算


                                                                                  ·143·
   150   151   152   153   154   155   156   157   158   159   160