Page 149 - 公共安全与应急管理研究

P. 149

第五章应急通信

信的需求。不同于阶段式调度，基于机器学习的动态调度方案则是一种利用数据
驱动的方案，能够根据实时的业务需求和资源状况，在线自动优化调度决策以提
高资源利用率，并满足业务实时性要求。针对面向延迟的物联网服务，提出了一

种基于深度强化学习的计算任务实时调度方案；建立了基于多智能体深度强化学
习的卫星网络决策实时调度模型，实现实时分布式卫星调度。为了实现算法复杂
度和实时性之间的权衡，提出了一种基于强化学习的两阶段启发式调度方法，以
支持边缘云计算场景中数据密集型任务的调度和执行。

综上所述，当前动态调度研究大多以临时到达的紧急任务为研究对象，采用
多目标决策和机器学习技术获取动态调度策略，主要具有以下优点：能很好地实
现多个优化目标的折衷；可以从宏观角度统一调度 SAGIECN 中的网络资源并提

高资源利用率；能较好地满足应急通信数据时效性的要求。实际上，任务到达的
动态性也可转换为网络拓扑的动态性，通过网络拓扑重构解决任务调度问题也是
一种新颖的思路。另外，综合考虑机器学习在复杂性、实时性和不确定性处理上
的优势，以及应急场景中大量的训练数据来源，机器学习在应急通信和救援场景
中的任务调度具有很大的可行性和潜力，可广泛应用于智能资源调度、自动化优

先级排序、预测任务执行情况和实时调度决策等应用中。
（二）任务调度决策
任务调度决策，是指调度控制和管理中心接受用户任务请求后，根据网络

的状态和需求，决定将任务分配给哪些资源节点上以及按何种顺序执行的问题。
SAGIECN 中的任务调度决策需要考虑多种因素，如卫星和无人机等资源实体的
实时状态、任务的特性、任务所需资源约束等。当前任务调度决策主要包括以提
高调度收益、提升网络性能和多目标权衡为目标的任务调度决策。
1. 以提高调度收益为目标的任务调度决策

作为调度系统的固有属性，调度收益是衡量调度系统性能的重要指标。调度
收益具有多种表现形式，主要包括任务完成数量、完成率和优先级等。为了降低
任务表征的复杂程度，许多研究对任务属性进行简化，仅关注任务的完成情况。

此外，在实际应用场景中，不同任务具有不同的执行优先级，完成较高优先级的
任务具有更高的调度收益。
2. 以提升网络性能为目标的任务调度决策
以提升网络性能为目标的任务调度决策，主要考虑网络的拥塞程度和资源消

135

144 145 146 147 148 149 150 151 152 153 154