Page 190 - 数学建模算法与应用
P. 190
Mathematical Modeling Algorithms and Applications
数学建模算法与应用
阶段指标之极大(或极小),即
这些形式下第 k 到 j 阶段子过程的指标函数为
根据状态转移的方程指标函数 其还可以表示为状态 和策略 的函数,
即 在 给定时指标函数 的最优值则称为最优值函数,记为
,即
其中 opt 可根据具体情况取 max 或 min 。
(七) 最优策略和最优轨线
让指标函数实现最优值的方法是从 k 点开始的后续子过程采取最优策略。意
味着在每个决策点上选择能够最大化(或最小化,视具体情况而定)整体效益
的行动方案,记作 是全过程的最优策略为最优策略(optimal
* * n 和状态转移方程演变所经历
policy)。从初始状 态 x 1 (= x 1 ) 出发,过程按照 P 1
的状态序列 称最优轨线。
(八)递归方程
如下方程称为递归方程
(2)
在上述方程中,当 为加法时取 当 为乘法时,取 动
态规划中的递归方程基于最优性原理构建,这一原理表明最优策略的任何部分本
身也必须是最优的。换句话说,如果一个策略在某个阶段被认为是最佳的,那么
这个策略在这个阶段之后的所有子阶段中也应当是最优的。用状态转移方程(1)
和递归方程(2)来解动态规划的过程,是由 k = n +1 逆推至 k = 1,这种方法称
为逆序解法。某些动态规划也可采用顺序解状态转移方程和递归方程:
180

