Page 147 - 生态环境保护与环境监测研究

P. 147

第六章空气质量预测预报

2. 原始数据多源异构，模型输入数据欠缺标准化
对数值模拟和统计学习方法来说，多源异构的原始数据都会造成模拟结果不

具有可比性。数值模拟方法中网格化清单的制作需要收集区域、行业、部门的大
气污染物排放量数据，其网格化过程中需要收集交通、能源、产业和自然资源

等社会经济数据。目前排放量数据和社会经济数据数出多门，原始数据多源异
构，根据原始数据制作的网格化排放清单也就有所差异。例如，中国环境科学研

究院、清华大学和中国科学研究院大气物理研究所等机构均有独立的排放清单数
据，同一研究区域内使用不同排放清单数据所得到的大气污染物浓度模拟结果往

往差异较大。对于统计学习方法来说，统计学习通常把长周期气象数据和大气污
染物监测数据作为输入数据，多源异构的原始数据作为输入数据投喂给模型进行

训练所引起的模型预测结果波动大，同一学习拟合过程难以重复。
3. 模型参数化方案缺少技术规范指导，预测模拟结果可比性差

数值模型方法需要针对给定区域和给定时间的模型选取不同的参数化方案，
目前国内很多研究在开展空气质量预测时对于参数化方案的选择仅限于通用方

案。我国大气污染物浓度监测网络的建设近年取得显著成果，但 PM 、PM 和
2.5
10
臭氧等主要大气污染物的历史监测数据还比较欠缺，缺乏长周期的观测数据对于
参数本地化造成较大困难。参数本地化的工作开展也较少，生态环境管理部门也
未针对参数化方案的选取给出相应的技术规范指导。通过数值模拟方法开展空气

质量预测还处在“百家争鸣”的阶段。统计学习算法模型中有大量参数需要调

试，目前对于使用机器学习、深度学习等经典算法开展空气质量预测的核心参数
率定的研究还较少，大量研究的参数方案无法复制。

4. 模拟结果评估指标和方法不一，模拟结果业务化程度低
针对数值模拟和统计学两类方法的预测和模拟均可以采用离散统计和分类统

计来进行统计学评估，以达到理想的模拟预测效果。目前国内外研究所采用的统
计评估指标多达数十种，离散统计包括相关系数、平均偏离（MB）、平均绝对总

误差（MAGE），分类统计包括准确率、偏离率、虚警率等。评估指标是决定模

139

142 143 144 145 146 147 148 149 150 151 152