Page 145 - 计算机应用软件开发技术研究
P. 145
第四章 大数据与机器学习
围绕数值天气预报从观测数据准备到临近预报和数值预测后处理数值的整个流程
介绍机器学习算法的应用。
1.数据获取
由于覆盖范围不完整或由于传感器问题,通常需要填补卫星图像的间隙。
Chang 等使用极限学习机(ELM)方法来填补中分辨率成像光谱仪(MODIS)
反射率数据中由于云量造成的空白,ELMs 调整速度很快,因为除了输出层权重
外,ELMs 的权重都是随机的,但是 ELMs 的精度通常低于其他架构。Vladimir
等使用浅层人工神经网络填补了全球海洋彩色图像中的空白。
2.数据预处理和反演
目前,一个比较有影响力的试点项目是 MI-IDAPS-AI,该项目将多仪器反演
和数据同化预处理系统(MIIDAPS)集群算法与 AI 算法融合,使得不同来源的
数据在拟合度、空间连贯性和参数间相关性方面得到进一步增强,另外采用 AI
算法后运算速度也得到了较大提升。
3.数据同化
当前的数据同化系统中,需要考虑观测值之间的相关性,为了缩短处理时
间,仅使用了小部分的可用观测值,通过机器学习算法可以加快数据同化的过
程。例如,Chevallier 等将正向模型的快速机器学习仿真用于卫星测量数据的
直接同化,Kras-nopolsky 等也将机器学习算法应用于瞬时垂直传播地面观测
资料。
4.短时临近预报
Iskenderian 等在卷积神经网络(CNN)框架中融合来自闪电传感器、卫星
图像和数值天气预报模型输出的数据,创建了无风天气雷达图像和 12 h 的短时
预报。Shahroudi 等在 CNN 中结合图像和数值天气预报输出预测了 18 h 热带气
旋路径和强度。Shi 等开发了一种 CNN 和长短记忆神经网络(LSTM)的组合用
于降水临近预报的短期外推法。Google 公司的 Sonderby 等提出了深度学习降水
预报模型 MetNet,实现 1 km 空间分辨率和 2 min 时间分辨率下全美国范围内提
前 7~8 h 降水预报,超过了 NOAA 使用大气模型结果。Qiu 等提出一种多任务卷
积神经网络用于降水量短期预测,考虑到不完整的观测以及临界点对其造成的
影响,该模型利用多个观测点的相关性进行预测,结果优于一系列基线模型。然
而,对于中小尺度对流系统的定点预报目前还有很大难度。
·133·

