Page 189 - 数学建模算法与应用
P. 189
第七章 动态规划研究
的允许决策集合。在例 1 中 u2 (B 1 ) 可取 C1,C 2 或 C 3 ,记作 u 2 (1) = 1,2,3,
而 U 2 (1) = {1,2,3}。决策变量简称为决策。
(四) 策略
n (x 1 ) ,即
决策组成的序列为策略。由初始状态 x 1 开始的全过程策略被记作 P 1
由第 k 阶段的状态 x k 开始到终止状态后部的子过程策略被记作 P k n (xk ) ,即
类似地,由第 k 到 j 阶段的子过程策略为
可供选择的策略有一定的范围,被称为允许策略集合:
(五)状态转移方程
在确定性过程中,当已知给定阶段的状态和决策时,下一阶段的状态就完全
确定了。使用状态转换方程来表示这一演化规律,记为:
(1)
在例 1 中状态转移方程为
(六)指标函数和最优值函数
指标函数用于评估过程的质量或效果,它是一个数量化的度量指标,适用于
整个过程以及后续的所有子过程中。这个函数能够帮助我们量化地理解不同阶段
或整体流程的表现。用 表示 k = 1,2,…,n 。指标函数应
具有可分离性,即 Vk n, 可表为 的函数,记为
,
并且函数 ϕk 对于变量 Vk ,n 是严格单调的。
+1
过程在第 j 阶段的阶段指标,须取决于状态 和决策 ,用 表示指
标函数由 组成常见的形式有:
阶段指标之和,即
阶段指标之积,即
179

