首页 历史故事地理探测器的应用和优势的分析

地理探测器的应用和优势的分析

【摘要】:利用地理探测器进行交通事故分析,主要包括空间网格划分、因子探测、交互作用探测、生态探测等步骤。地理探测器在进行计算时,需要将数据离散化,进行分级。表3.8是纽约市曼哈顿区的交通事故风险单一因子探测的结果,可以发现,路网密度是决定交通事故发生数量的最主要因素,其次为交通设施密度。表3.11交通事故的生态探测结果

地理探测器由一套探测空间分布异质性并揭示其背后驱动力的统计学方法组成(王劲峰,2010)。其基本假设为:如果某个自变量对某个因变量有重要影响,那么自变量和因变量的空间分布应该具有相似性。其理论核心是通过计算空间异质性来探测因变量与自变量之间空间分布格局的一致性,并由此来衡量自变量对因变量的解释度。常用的地理探测手段包括:莫兰指数、地理加权回归、空间扫描统计、空间贝叶斯模型等。基本流程是将研究空间赋予矢量边界,如格网划分、行政边界划分、泰森多边形划分等,每个矢量多边形都具有一系列的属性值,研究导致因变量的主要驱动要素(吕晨,2017)。

地理探测器有3个方面的用途:①度量给定数据的空间分异性;②寻找变量最大的空间分异;③寻找因变量的解释变量。例如:目前地理探测器已用于探究人口格局演化规律(尹上岗,2018)、租金空间分布(廖颖,2016)、环境适宜度评价(杨丰硕,2018)、经济差异影响(Li M,2019)等领域。

利用地理探测器进行交通事故分析,主要包括空间网格划分、因子探测、交互作用探测、生态探测等步骤。

1.空间网格划分

具有高分辨率的规则网格优于主观定义的区域,根据编码系统下的经度和纬度,将研究区域分为棋盘格结构(Li J,2018)。建立了一个时空多维数据集模型,不同的网格具有不同的属性。该模型用于执行时间管理,回溯、发现时空热点,进行空间统计和地理信息数据的叠加计算。

时空多维数据集模型是一种三维地理可视化分析技术,它将时空数据映射到多维数据集中,对于发现时空模式非常有用。覆盖相同的空间位置,分布在不同时间步长范围内的条形图具有相同的位置ID,并形成条形图时间序列。在相同的时间范围内,分布在不同空间位置的条形图共享相同的时间ID,并形成一个时间片。基于此模型,描述来自三个异构信息面、语义、空间和时间/图层的数据,以通过时空快照获取任何属性下的层切片。该模型的优点是可共享,存储和查询便捷,这有助于空间数据挖掘(朱婷婷,2020)。

经过实验对比,将纽约市曼哈顿区的外包矩形划分为500m×500m的空间格网,进行裁剪等操作后,研究区域共有233个空间格网。对每一个格网赋予一定的属性,从一定的维度上描述不同要素的空间分布状态的,每一个格网都视为一个独立的元胞,进行格网内计算与格网间相关联性对比。

为评估纽约市曼哈顿区的交通事故风险,选取路网密度、交通设施点密度、学校密度、医院密度、应急设施密度、文化设施密度作为影响因素,进行分析,如图3.22所示。地理探测器在进行计算时,需要将数据离散化,进行分级。不同的数据分级可能对实验结果产生不同的影响。经过反复测试,将所有的评估指标进行等距划分,划分为10个级别。评估方法采用常用的核密度估计。

图3.22 各风险因子密度分布

2.因子探测

地理学中有一个广泛认同的基本假设,即空间要素之间的距离越近,相关性越强;距离越远,相关性越弱。要素之间的地理隔离会导致空间异质性。地理探测器的目的就是为了衡量存在的空间异质性,并用统计参数q来表示(王劲峰,2010)。统计指标参数q计算公式如下:

q可以通过一个简单变换来服从F非中心分布,来检验参数的显著性

表3.8是纽约市曼哈顿区的交通事故风险单一因子探测的结果,可以发现,路网密度是决定交通事故发生数量的最主要因素,其次为交通设施密度。交通设施包括公交车站点、停车场等。而文化设施、应急设施的密度对交通事故的发生影响较小。

表3.8 交通事故的风险因子探测结果

3.交互作用探测

识别不同要素图层之间的相互作用,对不同的图层要素进行交互,探测交互作用下对因变量更好的解释拟合作用,不同要素之间的交互作用会出现表3.9中的情况。

表3.9 不同要素之间的交互作用

对纽约市曼哈顿区的交通事故风险的不同要素进行交互探测,得到的是两两变量交互作用后的q值,见表3.10,任何两种变量对事故发生的交互作用都要大于第一种变量的独自作用。

表3.10 交通事故的因子交互探测结果

4.生态探测

地理探测器的生态探测用于比较不同的要素图层对因变量空间分布的影响是否存在显著性差异,以统计量F表示程度:

其中,NX1与NX2代表样本采样量;SSW代表不同要素图层的方差和;L1与L2表示要素图层的离散化分级数。如果在显著水平下拒绝零假设,则表示两个要素对因变量的影响存在显著差异。

对纽约市曼哈顿区的交通事故风险进行生态探测计算,采用置信度为0.05的F检验,“Y”表示存在统计性差异,“N”表示不存在统计性差异。可以发现,文化设施与医疗设施、应急设施存在统计性差异,而其他两两因素之间均不存在统计性差异。尤其对于路网密度而言,路网连接着各类设施,与日常生活行动密切相关,对事故产生有着重要的影响作用。交通事故的生态探测结果见表3.11。

表3.11 交通事故的生态探测结果