Page 186 - 数学建模算法与应用
P. 186
Mathematical Modeling Algorithms and Applications
数学建模算法与应用
Optimization: Networks and Matroids),其中详细介绍了动态规划在组合优化中
的应用。
现代发展与应用于 1980 年代,随着计算机技术的发展,动态规划在更大规
模问题中的应用成为可能。1980 年代初,研究人员开始将动态规划与其他优化
方法结合,如分支定界法和割平面法,以解决更复杂的优化问题。
1990 年代时动态规划在机器学习和人工智能领域开始得到应用。1994
年,Sutton 和 Barto 出版了《强化学习:引入》(Reinforcement Learning: An
Introduction),其中介绍了动态规划在强化学习中的应用,如值迭代和策略迭代
等方法。
2000 年代时动态规划在大数据和云计算时代继续发展。研究人员提出了
多种并行化和分布式计算的动态规划算法,以解决大规模优化问题。2006 年,
Vijay Vazirani 出版了《近似算法》(Approximation Algorithms),其中讨论了动
态规划在近似算法中的应用。
2010 年代至今,动态规划在深度学习和强化学习中的应用日益广泛。2015 年,
DeepMind 团队在《自然》杂志上发表论文,介绍了 AlphaGo 如何使用动态规划
方法来优化围棋策略。2018 年,Sutton 和 Barto 更新了《强化学习:引入》一书,
进一步介绍了动态规划在现代强化学习中的应用。
动态规划在经济管理、生产调度、工程技术和最优控制等领域得到了广泛的
应用。例如,动态规划方法更方便地解决最短路线、库存管理、资源分配、设备
升级、分拣和装载等问题。虽然动态规划主要用于解决分为时间阶段的动态过程
的优化问题,但如果人为引入时间因素并将其视为多阶段决策过程,一些与时间
无关的静态规划(如线性规划和非线性规划)也可以很容易地通过动态规划方法
求解。
动态规划是一种解决特定类型问题的方法,是研究问题的一种方式,而不是
一种特殊的算法(例如线性规划是一个算法)。因此,与线性规划不同,它没有
标准的数学表达式或明确定义的规则集,须对特定问题进行具体的分析和处理。
因此,除了理解基本概念和方法外,还须建立具有丰富想象力的模型,并使用创
造性的方法。
例 最短路线问题
图 7-1 展示了一个网络布局,其中连接线旁的数字代表两节点间相隔的距离
176

