Page 189 - 数学建模算法与应用

P. 189

第七章动态规划研究

的允许决策集合。在例 1 中 u2 (B 1 ) 可取 C1，C 2 或 C 3 ，记作 u 2 (1) = 1，2，3，
而 U 2 (1) = {1，2，3}。决策变量简称为决策。

（四）策略
n (x 1 ) ，即
决策组成的序列为策略。由初始状态 x 1 开始的全过程策略被记作 P 1

由第 k 阶段的状态 x k 开始到终止状态后部的子过程策略被记作 P k n (xk ) ，即

类似地，由第 k 到 j 阶段的子过程策略为

可供选择的策略有一定的范围，被称为允许策略集合：

（五）状态转移方程

在确定性过程中，当已知给定阶段的状态和决策时，下一阶段的状态就完全
确定了。使用状态转换方程来表示这一演化规律，记为：

（1）
在例 1 中状态转移方程为
（六）指标函数和最优值函数

指标函数用于评估过程的质量或效果，它是一个数量化的度量指标，适用于
整个过程以及后续的所有子过程中。这个函数能够帮助我们量化地理解不同阶段

或整体流程的表现。用表示 k = 1，2，…，n 。指标函数应
具有可分离性，即 Vk n，可表为的函数，记为
,

并且函数 ϕk 对于变量 Vk ,n 是严格单调的。
+1
过程在第 j 阶段的阶段指标，须取决于状态和决策，用表示指
标函数由组成常见的形式有：
阶段指标之和，即

阶段指标之积，即

179

184 185 186 187 188 189 190 191 192 193 194