Page 190 - 数学建模算法与应用
P. 190

Mathematical Modeling Algorithms and Applications
             数学建模算法与应用






                  阶段指标之极大(或极小),即




                  这些形式下第 k 到 j 阶段子过程的指标函数为
                  根据状态转移的方程指标函数                 其还可以表示为状态             和策略      的函数,

             即             在   给定时指标函数                 的最优值则称为最优值函数,记为

                   ,即




                  其中 opt 可根据具体情况取 max 或 min 。

                 (七) 最优策略和最优轨线
                  让指标函数实现最优值的方法是从 k 点开始的后续子过程采取最优策略。意

             味着在每个决策点上选择能够最大化(或最小化,视具体情况而定)整体效益

             的行动方案,记作                           是全过程的最优策略为最优策略(optimal
                                         *                 *  n 和状态转移方程演变所经历
             policy)。从初始状 态 x 1  (= x 1  ) 出发,过程按照 P 1
             的状态序列                  称最优轨线。
                 (八)递归方程

                  如下方程称为递归方程


                                                                                          (2)


                  在上述方程中,当 为加法时取                          当 为乘法时,取                   动
             态规划中的递归方程基于最优性原理构建,这一原理表明最优策略的任何部分本
             身也必须是最优的。换句话说,如果一个策略在某个阶段被认为是最佳的,那么

             这个策略在这个阶段之后的所有子阶段中也应当是最优的。用状态转移方程(1)

             和递归方程(2)来解动态规划的过程,是由 k = n +1 逆推至 k = 1,这种方法称
             为逆序解法。某些动态规划也可采用顺序解状态转移方程和递归方程:



             180
   185   186   187   188   189   190   191   192   193   194   195