Page 193 - 数学建模算法与应用
P. 193

第七章  动态规划研究


                   按照上文的(3),(4)逆向计算出                        为全过程的最优值。             的最优

               决策为                       按照状态转移方程计算出最优状态为                       并得到相
               应最优决策为             于是最优策略为
                                                                                       *
                   由图 7-2 可知,左边部分是函数序列的递推计算过程,可输出最优值 f 1 (x 1 )

               的全过程,还可以输出后部子过程的最优值函数序列                                   和最优决策序列
                     计算过程中 fk  算完后可用 fk  将 fk 替换掉;存                      是备右边部分读
                                   -1
                                                  -1
                    之用。
                   图的右边部分是最优状态和最优决策序列的正向计算,可输出最优策略

                                    和最优轨线


                              第四节  动态规划与静态规划的关系



                   动态规划与静态规划(包括线性和非线性规划等方法)的研究对象,在本质
               上都是在若干约束下的函数极值问题。该两种规划在很多情况下从原则上讲是可

               以相互转换的。
                                                                          n (x 1 ,u 1 ,u 2  ,…,
                   动态规划可以看作是求决策u 1  ,u 2  ,…,u n  ,其是使指标函数V 1
               u n  ) 达到最优的极值问题,原则上可以用非线性规划方法求解。一些静态规划只

               要适当引入阶段的变量、状态、决策等就可以用动态规划方法求解。
                   例   用动态规划解下列非线性规划








                   其中        为任意的已知函数。
                   解 按变量 uk 的序号来划分阶段,作为 n 段决策过程。设各状态为 x 1  , x 2  ,…,

               x n+1 ,取问题中的变量 u 1  ,u 2  ,…,u n  为决策。状态转移方程



                          为阶段指标,其最优值函数的方程为(x n+1  = 0 )



                                                                                      183
   188   189   190   191   192   193   194   195   196   197   198