Page 27 - 当代控制理论及应用技术概论

P. 27

第一章控制理论概述

所得出的最优控制必要条件与变分法所得的条件的差别，仅在于用哈密顿函数在
最优控制上取值的条件代替，可以看出，后者可以作为前者的特殊情况。其他条
件包括正则方程，横截条件，边界条件等都一样。需要注意的是，极小值原理解
决最短时间控制问题时，最短时间的控制量只能取约束的边界值 +1 或 -1；而最
少燃料控制的控制量可取边界值 +1、-1、0。

用极小值原理解非线性系统的最优控制将导致非线性两点边值问题，这类
问题求解是很困难的。即使系统是线性的，但当指标函数是最短时间、最少燃料
这种形式，要求得到最优控制的解析表达式，并构成反馈控制（即把 U（t）表

示为 X（t）的函数）也是非常困难的。
（3）动态规划
动态规划又称为多级决策理论，是贝尔曼提出的一种非线性规划方法。它
将一个多级决策问题化为一系列单极决策问题，从最后一级状态开始到初始状态
为止，逆向递推求解最优决策。动态规划法原理简明，适用于计算机求解，在许

多理论问题的研究中，都应用到动态规划的思路。
动态规划问世以来，在经济管理、生产调度、工程技术和最优控制等方面
得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装

载等问题，用动态规划方法比用其它方法求解更为方便。
虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题，但是
一些与时间无关的静态规划（如线性规划、非线性规划），只要人为地引进时间
因素，把它视为多阶段决策过程，也可以用动态规划方法方便地求解。
动态规划概念引入：在现实生活中，有一类活动的过程，由于它的特殊性，

可将过程分成若干个互相联系的阶段，在它的每一阶段都需要作出决策，从而使
整个过程达到最好的活动效果。因此各个阶段决策的选取不能任意确定，它依赖
于当前面临的状态，又影响以后的发展。当各个阶段决策确定后，就组成一个决

策序列，因而也就确定了整个过程的一条活动路线．这种把一个问题看作是一个
前后关联具有链状结构的多阶段过程就称为多阶段决策过程，这种问题称为多阶
段决策问题。在多阶段决策问题中，各个阶段采取的决策，一般来说是与时间有
关的，决策依赖于当前状态，又随即引起状态的转移，一个决策序列就是在变化
的状态中产生出来的，故有“动态”的含义，称这种解决多阶段决策最优化的过

程为动态规划方法。

19
19

22 23 24 25 26 27 28 29 30 31 32