Andersen 采样器是一个多级、多孔的瀑布式撞击采样器,基于惯性撞击理论并根据人体呼吸系统的尘采集特性设计。洛伦兹曲线是美国统计学家M.O 洛伦兹在1907年提出的,主要是为了比较和分析一个国家或者一个地区在同一时代的财富不平等性,该曲线在财富分配和收入的便利图形方法上得到了广泛的应用。......
2023-11-17
如图1 所示,构建上海市大气PM2.5 浓度预测模型共分两个主要步骤:①对含缺失值的AOD 原始数据进行补缺;②结合地面监测站PM2.5 浓度训练及评价模型,并预测全上海市日均PM2.5 浓度。
图1 上海市大气PM2.5 浓度预测模型构建流程
1.6.1 缺失AOD 观测值的多重填补
既往的缺失值填补方法假定数据中的缺失值可以完全由其他观测变量所解释。然而,由于填补过程必然引入随机误差,该类方法通常会提高数据的变异性[10]。而多重填补法则通过回归方程多次迭代填补同一缺失值以减小随机误差对整体数据的影响,因而具有更高的可靠性[11]。
为了获取足够多的已知AOD 数据以增加补缺结果的稳健性,本研究采用7 d 滚动窗口的形式进行缺失值填补。即为某个给定日期Z 填补AOD 缺失值所用的AOD 观测值取自Z-3、Z-2、Z-1、Z、Z+1、Z+2 及Z+3 等7 d 中所有的AOD 观测值。最终的补缺方程如下:
式中,AOD,ij——第i 天中,第j 个MAIAC 1 km 网格的气溶胶光学厚度;
β——各自变量的回归系数;
Xj,Yj——该网格的经、纬度坐标;
s()——平滑气溶胶空间分布的立方样条函数;
CF,ij——第i 天中,第j 个MAIAC 网格的云量;
Tij——第i 天中,第j 个MAIAC 网格的温度;
RH,ij——第i 天中,第j 个MAIAC 网格的相对湿度;(www.chuimin.cn)
SH,ij——第i 天中,第j 个MAIAC 网格的比湿度;
Ej——第j 个MAIAC 网格的海拔;
Dj——第j 个MAIAC 网格滚动窗口的哑变量;
ε——残差。
值得注意的是,为保证填充结果的可靠性,仅使用原始观测值填充未知AOD 数据,即通过多重填补法计算得的AOD 值不会进入新一轮的补缺计算。此外,若7 d 滚动窗口内累计AOD 数值不超过4 000 个,则该日数据不进行补缺,并记为完全缺失。在补缺过程中独立处理取自Terra 和Aqua 平台的AOD 数据。在补缺完成后,取Terra AOD 和 Aqua AOD 的平均值以最终构建环境PM2.5 浓度预测模型。
1.6.2 随机森林预测模型的构建及评价方法
采用随机森林回归模型构建上海市PM2.5 浓度预测模型并预测全市2017-2018年的日均PM2.5 浓度分布。该模型是一种以决策树(Decision Tree)为基本单元的集成学习方法[12]。相较于传统的回归模型而言,机器学习模型在自变量具有高度自相关及复杂交互作用时具有较大的优势。
随机森林算法的Bootstrap 方法决定了其在自变量维度较高时仍能有稳定的预测性能。因此,在建模时纳入了所有可能潜在影响模型性能的自变量以提升预测能力(见表2)。
表2 随机森林模型中纳入的自变量
采用均方误差的百分比提升(记为%IncMSE)这一指标来衡量不同自变量在随机森林预测模型中的重要性。该指标表示在其他自变量均不变的情况下,若某一特定自变量被随机重排,模型预测结果的均方误差所提升的百分比。百分比越高,则代表这一自变量在原预测模型中的不可替代性越强(即重要性越高)。作为一个无量纲的指标,%IncMSE 便于进行自变量的横向对比及排序。
模型评价体系包括:①袋外(OOB)R2 估计,该指标来自随机森林模型中的Bootstrap 方法,表示所有决策树在没有参与自身构建的样本中的预测结果与真实值之间的决定系数;②10 折交叉验证(10-fold Cross-Validation)法,即随机10 等分模型数据,每次用其中的9 份作为训练集构建随机森林模型,另一份作为验证集生成预测结果,并重复上述过程10 次直到所有观测值均有一个预测值相匹配,随后计算预测值-观测值间的决定系数、均方根误差(Root Mean Square Error,RMSE)及单因素回归方程的斜率以评价模型;③10 折空间验证(10-fold Spatial Validation),该PM2.5 在空间外推上的可行性需通过10 折空间验证来评价,即依据训练集的空间坐标将其随机分成10 等份,其中9 份作为训练集拟合模型,1 份作为验证集评价模型。该方法确保每次用以建模的训练集与验证集在空间坐标上不存在任何交叉,是无偏评价外推性能的最佳方法,其评价指标与10 折交叉验证相同,为预测值-观测值间的R2,均方根误差及相应回归方程斜率。
有关上海环境科学集 第23辑的文章
Andersen 采样器是一个多级、多孔的瀑布式撞击采样器,基于惯性撞击理论并根据人体呼吸系统的尘采集特性设计。洛伦兹曲线是美国统计学家M.O 洛伦兹在1907年提出的,主要是为了比较和分析一个国家或者一个地区在同一时代的财富不平等性,该曲线在财富分配和收入的便利图形方法上得到了广泛的应用。......
2023-11-17
The Optimisation Method for Marine Environmental Monitoring Siting and Its Application范海梅 纪焕红 刘鹏霞 张正龙 周红宏Fan Haimei Ji Huanhong Liu Pengxia Zhang Zhenglong Zhou Honghong摘要 探讨了海洋环境监测站位优化步骤、方法和基本原则。本文探讨了海洋环境监测站位优化步骤、方法和基本原则。监测方案的优化设计与海洋环境评价是相辅相成的,监测方案的优化与评估是基于历史的监测评价结果,而科学合理的海域环境评价是基于更合理的监测方案。......
2023-11-17
问题诊断是适应性管理的前提,通过基本资料收集与补充监测,选择合适概念化模型对水质变化过程及控制因子进行的科学认知,进行水质目标达标的问题识别。海河干流水质及浮游植物既往监测数据收集与补充实测。......
2023-11-17
[1]石俊锋,符钢战,施欢.基于全生命周期评价的车身选材研究[J].上海汽车,2017(1):56-62.[2]佚名.捷豹XFL实车体验[EB/OL].http://www.sohu.com/a/111840041_196557.2016-08-24.[3]佚名.金属铝的生产方法新进展[EB/OL].https://wenku.baidu.com/view.2017-09-05.[4]冯延磊,胡全......
2023-11-17
镇江市作为国家首批海绵城市试点之一,早在2007年就已经开始了探索。对此,镇江市创造性地提出了“海绵+”模式。“海绵+”模式即在对老旧城区进行海绵城市改造时,将所有市政配套设施一并改造,实现海绵和城建的有机融合。“海绵+”模式分为“海绵+城建”模式和“城建+海绵”模式[6]。......
2023-11-17
2.3.2 霉菌鉴定结果分析在甘肃省人民医院前广场采样器第5 层采集到目标菌株,使用FF 接种液,在培养96 h 后得到鉴定结果为:Aspergillus ostianus Wehmer BGB(孔曲霉),该菌菌落质地丝绒状、平薄或微皱。......
2023-11-17
企业要在当前环保整治中由原来依靠行政力量强推的被动模式改为主动发现问题、整改问题,并借助技术实力可靠的第三方机构从环保手续、三废设施和环境风险管控等多个环节着手,对症下药,在经济可行的基础上建议企业可以委托第三方开展环保管家服务。鼓励企业进行产品升级、技术设备改造,尤其是能够降低污染物排放的工艺设备改造,环保部门应该为企业提供环保手续完善的思路及建议。......
2023-11-17
冬季兰州市主城区取暖和生活用煤致使较大的粒径颗粒物分布相对均匀,而汽车尾气的排放和其他因素的影响则导致了能够呼入人体末端支气管的粒径颗粒物分布相对不均衡,空间洛伦兹曲线法得到的分析结果和现实情况基本相符。以图2 中春季PM10.0-9.0 的洛伦兹曲线为例,从原点开始,应分别代表兰州大学6 号公寓、天庆丽舍情园、天庆嘉园A 区、甘肃环境科技大厦、兰炼宾馆。......
2023-11-17
相关推荐