Page 189 - 数学建模算法与应用
P. 189

第七章  动态规划研究


               的允许决策集合。在例 1 中 u2 (B 1  ) 可取 C1,C 2  或 C 3  ,记作 u 2  (1) = 1,2,3,
               而 U 2  (1) = {1,2,3}。决策变量简称为决策。

                   (四) 策略
                                                                               n (x 1  ) ,即
                   决策组成的序列为策略。由初始状态 x 1  开始的全过程策略被记作 P 1


                   由第 k 阶段的状态 x k  开始到终止状态后部的子过程策略被记作 P k                     n (xk ) ,即



                   类似地,由第 k 到 j 阶段的子过程策略为


                   可供选择的策略有一定的范围,被称为允许策略集合:


                   (五)状态转移方程

                   在确定性过程中,当已知给定阶段的状态和决策时,下一阶段的状态就完全
               确定了。使用状态转换方程来表示这一演化规律,记为:

                                                                                                    (1)
                   在例 1 中状态转移方程为
                   (六)指标函数和最优值函数

                   指标函数用于评估过程的质量或效果,它是一个数量化的度量指标,适用于
               整个过程以及后续的所有子过程中。这个函数能够帮助我们量化地理解不同阶段

               或整体流程的表现。用                              表示 k = 1,2,…,n 。指标函数应
               具有可分离性,即 Vk n, 可表为                      的函数,记为
                                   ,


                   并且函数 ϕk 对于变量 Vk ,n 是严格单调的。
                                          +1
                   过程在第 j 阶段的阶段指标,须取决于状态 和决策 ,用                                   表示指
               标函数由                 组成常见的形式有:
                   阶段指标之和,即




                   阶段指标之积,即



                                                                                      179
   184   185   186   187   188   189   190   191   192   193   194