首页 理论教育上海PM2.5时空分布模型及环境科学研究第23辑

上海PM2.5时空分布模型及环境科学研究第23辑

【摘要】:为解决卫星数据的非随机性缺失会显著降低PM2.5 浓度预测模型准确性的问题,运用多重填补法对MAIAC 1 km 分辨率气溶胶光学厚度数据的缺失值实现补缺,其平均决定系数达0.75。在此基础上,运用随机森林模型构建上海市2017-2018年的PM2.5 浓度分布预测模型,其决定系数达0.96。结果表明,上海市PM2.5 分布整体呈现东低西高、沿海低内陆高的趋势,且2018年上海市PM2.5 浓度整体低于2017年。气溶胶光学厚度数据是PM2.5 预测模型中最重要的自变量。

Predicting Ambient PM2.5 Concentrations in Shanghai from MAIAC AOD

朱清扬1 戴海夏2 刘 阳3* 张蕴晖1*(1.复旦大学公共卫生学院环境卫生学教研室,上海 200032;2.上海市环境科学研究院,上海 200233;3.埃默里大学罗琳斯公共卫生学院环境卫生学系,亚特兰大 30322)

Zhu Qingyang1 Dai Haixia2 Liu Yang3* Zhang Yunhui1*(1.Department of Environmental Hygiene,School of Public Health,Fudan University,Shanghai 200032;2.Shanghai Academy of Environmental Sciences,Shanghai 200233;3.Department of Environmental Health,Rollins School of Public Health,Emory University,Atlanta,GA 30322,USA)

摘要 卫星技术的不断发展成熟使构建高分辨率的PM2.5 浓度预测模型成为可能。为解决卫星数据的非随机性缺失会显著降低PM2.5 浓度预测模型准确性的问题,运用多重填补法对MAIAC 1 km 分辨率气溶胶光学厚度数据的缺失值实现补缺,其平均决定系数达0.75。在此基础上,运用随机森林模型构建上海市2017-2018年的PM2.5 浓度分布预测模型,其决定系数达0.96。结果表明,上海市PM2.5 分布整体呈现东低西高、沿海低内陆高的趋势,且2018年上海市PM2.5 浓度整体低于2017年。气溶胶光学厚度数据是PM2.5 预测模型中最重要的自变量

关键词:PM2.5 浓度预测模型 随机森林回归模型 气溶胶光学厚度 多重填补 上海

Abstract The development of remote sensing technology has provided the possibility of establishing high-resolution PM2.5 prediction models.The present study applied multiple imputation method to fill-in the missing aerosol optical depth(AOD) values with 1 km resolution in MAIAC(multi-angle implementation of atmospheric correction),the R2 of which reached 0.75.Based on the full-coverage AOD data,random forest model was further utilised to predict ambient PM2.5 concentrations.The model yielded an R2 of 0.96.The results demonstrated an increasing trend of ambient PM2.5 concentrations in Shanghai from east to west.Compared to 2017,the annual mean PM2.5 concentrations decreased by 4 μg/m3 in 2018.In this model,gap-f illed aerosol optical depth data was the most important predictor.

Key words:Prediction model for PM2.5 contents Random forest regression model Aerosol optical depth(AOD) Multiple imputation Shanghai(www.chuimin.cn)

科技部国家重点研发计划青年项目(编号:2016YFC0206800)资助。

第一作者朱清扬,男,1993年生,2016年毕业于东南大学公共卫生学院,在读硕士研究生。

*通信联系人,yang.liu@emory.edu; yhzhang@shmu.edu.cn。

近年来,卫星遥感技术的发展为环境PM2.5 暴露评估提供了强有力的工具。美国国家航空航天局(National Aeronautics and Space Administration,NASA)于1999年和2002年发射了2 颗地球观测系统(Earth Observing System,EOS)卫星,并分别命名为Terra 和Aqua。上述卫星均搭载有中分辨率成像光谱仪(Moderate Resolution Imaging Spectroradiometer,MODIS),可提供可见光-近红外波段的气溶胶光学厚度(Aerosol Optical Depth,AOD)数据,其对应的气溶胶粒径在0.1~2μm,与PM2.5 的粒径范围相似,二者在统计学上具有良好的相关性[1]

在MODIS AOD 的基础上,Alexei Lyapustin 等进一步提出了大气校正的多角度实现(Multiangle implementation of atmospheric correction,MAIAC)算法。该方法基于时间序列分析来反演气溶胶特征及表面双向反射系数,进一步将AOD 产品的分辨率提升至1 km[2,3]。该算法的出现为构建高分辨率的大气PM2.5 浓度预测模型提供了理论基础。然而,一个亟待解决的问题是,卫星数据的非随机性缺失会显著降低PM2.5 浓度预测模型的准确性[4-6],因此一些研究引入插值法以平滑大气细颗粒物的空间分布[7]。该方法的优点在于建模过程完全基于原始卫星AOD观测值,不确定性较低。但其过于依赖地面监测点的密度,且平滑过程会人为降低PM2.5 在空间中的变异度。Xiao 等提出了卫星AOD 数据的多重插补(Multiple Imputation,MI)策略,利用气溶胶光学厚度与云量、气象学条件的相关性及其自身在时空分布上的连续性来构建线性回归模型,并在滚动的时间窗内运用Bootstrap 法迭代填充缺失的AOD 观测值[8]。其填充结果具有较高的准确性,已被成功运用于高分辨率卫星PM2.5 模型的构建中[8,9]

由卫星数据所驱动的统计学模型可以有效弥补地面监测站PM2.5 数据在空间分布上的局限性,从而为大型流行病学研究提供可靠的大气细颗粒物暴露评估数据。本研究旨在以MAIAC AOD 产品为基础,在上海市范围内构建分辨率为1 km 的大气细颗粒物浓度预测模型。