Page 193 - 数学建模算法与应用

P. 193

第七章动态规划研究

按照上文的（3），（4）逆向计算出为全过程的最优值。的最优

决策为按照状态转移方程计算出最优状态为并得到相
应最优决策为于是最优策略为
*
由图 7-2 可知，左边部分是函数序列的递推计算过程，可输出最优值 f 1 （x 1 ）

的全过程，还可以输出后部子过程的最优值函数序列和最优决策序列
计算过程中 fk 算完后可用 fk 将 fk 替换掉；存是备右边部分读
-1
-1
之用。
图的右边部分是最优状态和最优决策序列的正向计算，可输出最优策略

和最优轨线

第四节动态规划与静态规划的关系

动态规划与静态规划（包括线性和非线性规划等方法）的研究对象，在本质
上都是在若干约束下的函数极值问题。该两种规划在很多情况下从原则上讲是可

以相互转换的。
n (x 1 ，u 1 ，u 2 ，…，
动态规划可以看作是求决策u 1 ，u 2 ，…，u n ，其是使指标函数V 1
u n ) 达到最优的极值问题，原则上可以用非线性规划方法求解。一些静态规划只

要适当引入阶段的变量、状态、决策等就可以用动态规划方法求解。
例用动态规划解下列非线性规划

其中为任意的已知函数。
解按变量 uk 的序号来划分阶段，作为 n 段决策过程。设各状态为 x 1 ， x 2 ，…，

x n+1 ，取问题中的变量 u 1 ，u 2 ，…，u n 为决策。状态转移方程

为阶段指标，其最优值函数的方程为（x n+1 = 0 ）

183

188 189 190 191 192 193 194 195 196 197 198