Page 193 - 数学建模算法与应用
P. 193
第七章 动态规划研究
按照上文的(3),(4)逆向计算出 为全过程的最优值。 的最优
决策为 按照状态转移方程计算出最优状态为 并得到相
应最优决策为 于是最优策略为
*
由图 7-2 可知,左边部分是函数序列的递推计算过程,可输出最优值 f 1 (x 1 )
的全过程,还可以输出后部子过程的最优值函数序列 和最优决策序列
计算过程中 fk 算完后可用 fk 将 fk 替换掉;存 是备右边部分读
-1
-1
之用。
图的右边部分是最优状态和最优决策序列的正向计算,可输出最优策略
和最优轨线
第四节 动态规划与静态规划的关系
动态规划与静态规划(包括线性和非线性规划等方法)的研究对象,在本质
上都是在若干约束下的函数极值问题。该两种规划在很多情况下从原则上讲是可
以相互转换的。
n (x 1 ,u 1 ,u 2 ,…,
动态规划可以看作是求决策u 1 ,u 2 ,…,u n ,其是使指标函数V 1
u n ) 达到最优的极值问题,原则上可以用非线性规划方法求解。一些静态规划只
要适当引入阶段的变量、状态、决策等就可以用动态规划方法求解。
例 用动态规划解下列非线性规划
其中 为任意的已知函数。
解 按变量 uk 的序号来划分阶段,作为 n 段决策过程。设各状态为 x 1 , x 2 ,…,
x n+1 ,取问题中的变量 u 1 ,u 2 ,…,u n 为决策。状态转移方程
为阶段指标,其最优值函数的方程为(x n+1 = 0 )
183

