信息工程学院

研究进展

牛猛/张玉清：基于深度学习的融合多源数据的PM2.5长时间序列预测【Atmospere, 2023】

2023-04-27 发布：信息工程学院点击：446次

当前，计算机与地学的交叉融合应用是地球科学领域中的热点前沿，充分利用计算机科学的理论和技术，解决传统地学领域问题，可以发现新的地学事实、科学规律，构建更精准、智能的地学模型。信息技术与地学深度融合，研究地学信息提取、表示、分析，对地质过程进行数值模拟以及通过深度学习建立更准确的地球科学模型，是地球科学领域的未来发展方向之一，对加深地球的形成演化、物质组成、气象预测等有极其重要的意义。

随着工业化的日益发展，PM_2.5造成的危害引起越来越多公众的关注，空气污染已成为导致公共健康问题的主要原因之一，对人体健康危害显著。PM_2.5主导的空气污染与多种疾病密切相关，如急性下呼吸道疾病、脑血管疾病、缺血性心脏病和肺癌等，全球每年有300多万人过早死亡。

因此，准确的PM_2.5空气污染预测对污染灾害防治、公众出行指导、甚至环保政策制定都具有重要意义，是当下地球科学领域内研究的热点问题。有效、可靠的预测模型不仅要对未来的短时间序列内实现精准预测，对长时间序列的未来预测更是尤为重要，目前所存在的大多数现有传统预测模型都会因逐步预测造成误差积累，导致PM_2.5的长时间序列预测准确度有待提升。

针对上述问题，我校信息工程学院硕士研究生牛猛在张玉清副教授的指导下，将人工智能方法应用至地学领域中的大气污染问题，提出了一种基于深度学习的PM_2.5预测模型，在对长时间序列的空气污染预测中有较好的性能表现。该工作的主要贡献如下：

1. 有效提取了北京市35个监测站的历史空气质量数据，同时充分考虑并融入气象数据的时空相关性，通过Spearman相关分析、以及气象学知识进行论证，选择空气质量数据中的AQI、CO、NO₂和PM₁₀浓度，以及气象数据中的露点温度和风速作为模型输入进行训练，预测效率提高近27%。

2. 所提出的预测器采用Spearman相关分析和Informer模型对北京市PM_2.5逐时浓度进行预测。模型接收超长的历史输入数据，并采用一步式直接生成预测输出，避免了由于分步预测而导致的错误积累。该预测器有效地解决了现有预测方法对长时间序列预测精度降低的问题，模型结构如图1所示。

3. 通过与LSTM、Attention-LSTM模型的预测表现对比（如表1、图2所示），本文提出的模型对未来7天、14天和未来1个月的逐时PM_2.5浓度预测均有较好的效果，在长时间序列的预测上有大幅度提高，对于政府治理政策制定和居民出行计划具有实际应用意义。

图1 本文模型架构

表1 LSTM、Attention-LSTM和本文模型在不同预测时间的性能表现

图2 三个模型在预测未来14天的散点图表现

(a)本文模型, (b) Attention-LSTM, (c) LSTM

上述研究成果发表在学术期刊《Atmosphere》，2022年IF=3.11

引用格式：Niu M, Zhang Y, Ren Z. Deep Learning-Based PM2.5 Long Time-Series Prediction by Fusing Multisource Data—A Case Study of Beijing. Atmosphere. 2023; 14(2):340.

全文链接：https://doi.org/10.3390/atmos14020340

校址：北京市海淀区学院路29号邮编：100083

校址：北京市海淀区学院路29号

邮编：100083

技术支持：信息网络与数据中心