首页 历史故事疫情数据的复杂网络建模优化方案

疫情数据的复杂网络建模优化方案

【摘要】:且此类节点越多,病毒就越容易传播,确诊人数也会增加得越快。因此,控制这些地理节点是阻止新一轮病毒传播的有效方法。通过控制几个社区间的紧密联系路径与关键地理节点,可以有效地防止社区间的交叉感染,阻止新一轮病毒的传播。

利用街道感染数据,依照引力模型构建街道之间的交互联系,以一定的阈值对交互边进行筛选(单勇,2018),以疫情街道作为网络节点,筛选后的节点之间的邻接关系构成网络的边,这样就构成了一个较为复杂的网络结构,这个网络结构甚至可能包含一件真实事件的大部分信息,网络结构的连接边隐含了疫情事件的变化趋势(如感染与讨论的地理重心迁移),解析这个结构可以从中挖掘到更多有价值的信息(感染社区地理划分、观点地理演化趋势、情绪演化趋势)。

复杂网络是大量真实复杂系统的拓扑抽象,可以用一张图来构建模型,G=(V,E)。其中,V代表复杂网络所有节点的集合,E代表所有边的集合,其中m为确定的节点数目,Ni,j代表第i个空间节点至第j个空间节点的联系度,Ni,j越大代表地区之间的关联性越强。

一个典型的复杂网络是由若干个节点以及之间不同权重的连接边构成的,而复杂网络内部又由若干个社区组成,同一社区内节点之间的互动会比在不同社区之间更加频繁(聂琦,2018)。为了构建复杂网络的边联系,利用基本的引力模型(又称重力模型、场强模型)来进行计算,引力模型构建的网络边表示小区之间的互相诱发作用。

引力模型是地理学的经典模型之一,基于地理学定律“所有的事物或现象在空间上都是有联系的,但相距近的事物或现象之间的联系一般较相距远的事物或现象间的联系要紧密”,被运用于空间布局、旅游、人口迁移等方面(房艳刚,2006)。该模型效仿牛顿万有引力定律,即两物体间的引力与两物体的质量之积成正比,而与它们之间距离的平方成反比类推得到。其基本思路可简单地描述为:两地间的引力与两地间某种规模量之积成正比,与两地距离的平方成反比。

在不同的应用场景上,两地规模量常有不同的表现形式。在旅游领域,两地规模量通常代表目的地的旅游供给水平和出游地的旅游需求水平;在两地空间联系方面,两地规模量通常以两地GDP、总人口的形式表示;在兴趣推荐研究中,该规模量被表示为兴趣点签到次数(Fonseca,et al.,2006)。本章以小区确诊人数作为规模量进行计算:

式中,参数A代表小区之间的联系度,D代表小区感染确诊数据,d代表小区之间的空间距离。

社区结构是复杂网络的一个重要拓扑结构特征,利用一种基于多层次优化的模块度Louvain算法对复杂网络的社区结构进行解析(张岩等,2020),发现小区间联系紧密且存在社区化或群组化的结构,具有速度快、效率高的优点。本研究利用疫情社区数据,通过模块度最优化和网络聚合两个步骤来划分舆情社区。

模块度是定义社区结构程度的评价指标,其数学定义如下(程学旗等,2011):

式中,Ai,j代表节点i与j之间的边的权重;ki代表节点的度;m代表复杂网络中节点的总数;Ci代表节点为i的社区。

将每个社区数据看做独立社区,初始社区数与舆情社区数相同。在此基础上基于模块度增益对所有节点进行融合凝聚,直至达到模块度局部最大值,即没有任何节点可以提高网络模块度为止,社区结构不再发生改变。最后,对社区结果进行压缩,将其内部节点权重转化为新的节点和权重,原社区间边的权重转换为节点间的权重。该地理传播算法如图5.6所示。

图5.6 社区压缩与空间引力示意图

除模块度之外,复杂网络还有以下一些性质:

①节点的度:有向图中,以某节点的弧尾条数为节点的出度,某节点的弧头条数为节点的入度,节点的度=出度+入度。出入度表示疫情的关联度,其中入度表示导致节点感染的诱因事件,出度表示该节点引发的感染事件,其数值由系统网络拓扑结构确定。节点出度越大,则该节点对周边造成的后果越严重;入度越大,则导致该节点的途径越多,控制难度越大。

②在复杂网络图中,图密度越大表示网络连接越紧密;模块度越大表示社区结构越明显;网络直径越小表示点之间的可达性越好;介数中心度量化了某节点在点对之间短路径上的联通能力(骆志刚等,2011)。一般来说,节点的出度越大表明该事件在公共卫生事件演化链网络中的影响越广泛,事件造成的后果越严重,是公共卫生事件灾情演化网络的中心节点;节点的入度越大表示事件的路径越多,控制难度越大,属于公共卫生事件灾情演化发展的关键节点(陆文慧,2019)。而介数中心度最大的节点与后续诱发的公共卫生事件联系的紧密程度最高。

本章基于引力模型,对微博复杂网络进行建模,在不同的联系度尺度下绘制节点之间的空间交互情况,如图5.7所示。以一个基本假设来进行推演,有确诊病例的小区对周边小区的影响作用,且这种影响随着确诊病例的数目的增加而增强,随着节点之间的距离的增加而减弱。那么疫情节点之间构成了一个互相影响的灾害传播链,利用复杂网络建模,希望发现传染链的社区结构。

图5.7 纽约市街道之间互相影响关系(节点越大代表街区确诊人数越多,连接边颜色越深代表街区之间的影响越紧密)

出度高的节点对病毒在网络中的传播有很大的影响,关键节点在疫情地理传播过程中的作用示意图如图5.8所示。且此类节点越多,病毒就越容易传播,确诊人数也会增加得越快。因此,控制这些地理节点是阻止新一轮病毒传播的有效方法。

图5.8 关键节点在疫情地理传播过程中的作用

根据复杂网络的特征,社区内的节点紧密相连,社区之间节点联系稀疏,这为预防和控制提供了可能性。通过控制几个社区间的紧密联系路径与关键地理节点,可以有效地防止社区间的交叉感染,阻止新一轮病毒的传播。