Page 27 - 当代控制理论及应用技术概论
P. 27
第一章 控制理论概述
所得出的最优控制必要条件与变分法所得的条件的差别,仅在于用哈密顿函数在
最优控制上取值的条件代替,可以看出,后者可以作为前者的特殊情况。其他条
件包括正则方程,横截条件,边界条件等都一样。需要注意的是,极小值原理解
决最短时间控制问题时,最短时间的控制量只能取约束的边界值 +1 或 -1;而最
少燃料控制的控制量可取边界值 +1、-1、0。
用极小值原理解非线性系统的最优控制将导致非线性两点边值问题,这类
问题求解是很困难的。即使系统是线性的,但当指标函数是最短时间、最少燃料
这种形式,要求得到最优控制的解析表达式,并构成反馈控制(即把 U(t)表
示为 X(t)的函数)也是非常困难的。
(3)动态规划
动态规划又称为多级决策理论,是贝尔曼提出的一种非线性规划方法。它
将一个多级决策问题化为一系列单极决策问题,从最后一级状态开始到初始状态
为止,逆向递推求解最优决策。动态规划法原理简明,适用于计算机求解,在许
多理论问题的研究中,都应用到动态规划的思路。
动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面
得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装
载等问题,用动态规划方法比用其它方法求解更为方便。
虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是
一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间
因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。
动态规划概念引入:在现实生活中,有一类活动的过程,由于它的特殊性,
可将过程分成若干个互相联系的阶段,在它的每一阶段都需要作出决策,从而使
整个过程达到最好的活动效果。因此各个阶段决策的选取不能任意确定,它依赖
于当前面临的状态,又影响以后的发展。当各个阶段决策确定后,就组成一个决
策序列,因而也就确定了整个过程的一条活动路线.这种把一个问题看作是一个
前后关联具有链状结构的多阶段过程就称为多阶段决策过程,这种问题称为多阶
段决策问题。在多阶段决策问题中,各个阶段采取的决策,一般来说是与时间有
关的,决策依赖于当前状态,又随即引起状态的转移,一个决策序列就是在变化
的状态中产生出来的,故有“动态”的含义,称这种解决多阶段决策最优化的过
程为动态规划方法。
19
19

