Page 149 - 公共安全与应急管理研究
P. 149
第五章 应急通信
信的需求。不同于阶段式调度,基于机器学习的动态调度方案则是一种利用数据
驱动的方案,能够根据实时的业务需求和资源状况,在线自动优化调度决策以提
高资源利用率,并满足业务实时性要求。针对面向延迟的物联网服务,提出了一
种基于深度强化学习的计算任务实时调度方案;建立了基于多智能体深度强化学
习的卫星网络决策实时调度模型,实现实时分布式卫星调度。为了实现算法复杂
度和实时性之间的权衡,提出了一种基于强化学习的两阶段启发式调度方法,以
支持边缘云计算场景中数据密集型任务的调度和执行。
综上所述,当前动态调度研究大多以临时到达的紧急任务为研究对象,采用
多目标决策和机器学习技术获取动态调度策略,主要具有以下优点:能很好地实
现多个优化目标的折衷;可以从宏观角度统一调度 SAGIECN 中的网络资源并提
高资源利用率;能较好地满足应急通信数据时效性的要求。实际上,任务到达的
动态性也可转换为网络拓扑的动态性,通过网络拓扑重构解决任务调度问题也是
一种新颖的思路。另外,综合考虑机器学习在复杂性、实时性和不确定性处理上
的优势,以及应急场景中大量的训练数据来源,机器学习在应急通信和救援场景
中的任务调度具有很大的可行性和潜力,可广泛应用于智能资源调度、自动化优
先级排序、预测任务执行情况和实时调度决策等应用中。
(二)任务调度决策
任务调度决策,是指调度控制和管理中心接受用户任务请求后,根据网络
的状态和需求,决定将任务分配给哪些资源节点上以及按何种顺序执行的问题。
SAGIECN 中的任务调度决策需要考虑多种因素,如卫星和无人机等资源实体的
实时状态、任务的特性、任务所需资源约束等。当前任务调度决策主要包括以提
高调度收益、提升网络性能和多目标权衡为目标的任务调度决策。
1. 以提高调度收益为目标的任务调度决策
作为调度系统的固有属性,调度收益是衡量调度系统性能的重要指标。调度
收益具有多种表现形式,主要包括任务完成数量、完成率和优先级等。为了降低
任务表征的复杂程度,许多研究对任务属性进行简化,仅关注任务的完成情况。
此外,在实际应用场景中,不同任务具有不同的执行优先级,完成较高优先级的
任务具有更高的调度收益。
2. 以提升网络性能为目标的任务调度决策
以提升网络性能为目标的任务调度决策,主要考虑网络的拥塞程度和资源消
135

