面对新发重大卫生事件,必须充分认识事件的“态”,通过科学手段及个人或集体的洞察力充分预测未来的“势”,并在此基础上做出决策。本章以美国新冠肺炎疫情为研究对象,进行疫情/舆情的发展态势分析、疫情防控与人口迁徙关联分析、多准则条件下的疫情风险评估和基于SIR模型的疫情传播分析。......
2023-06-15
对盗窃犯罪案件类别、时间段、网格编号等属性信息,选择合适的支持度和置信度阈值,进行关联规则挖掘。由于数据量过于庞大,为提取出有意义的强关联规则,设置最小支持度为0.0007,最小置信度为0.2,计算提取满足最小支持度与最小置信度的强关联规则集。按照关联规则长度为3,提升度大于1.2的原则进行筛选,得到共计68条强关联规则。0~6时间段,由于案发数目相对而言较少,规则由于支持度较小被淹没,仅有6条强关联规则,6~12时间段对应9条强关联规则,12~18时间段对应27条强关联规则,18~24时间段对应26条强关联规则。通过分析得到的强关联规则,推出犯罪类型、网格号与时间段这三个案件属性之间所存在的关联关系,进而推测盗窃犯罪的时空规律。部分强关联规则见表6.3,以关联规则“{案件类别=轻型犯罪,地理格网=120}=>{时间段=6_12}”为例,在这条记录中,规则前项是{案件类别=轻型犯罪,地理格网=120},规则后项是{时间段=6_12},表示在网格编号为120的区域,在6_12时间段最有可能发生轻型犯罪。
表6.3 部分强关联规则
使用聚类方法将强规则分组,若规则前项和后项统计上是相似的则被归为一类,实现强关联规则基于矩阵的可视化,如图6.18所示。横坐标为关联规则前项的数目,纵坐标为关联规则后项,圆圈的颜色深浅表示提升度的大小,圆圈的大小表示聚合后的规则支持度相对大小。可以发现,在12~18时间段的强关联规则在数量、支持度和置信度方面更为均衡,其时空关联性更为显著,且出现多个小的聚类中心,更有助于相关部门在关键时段和关键区域进行警力重点配置。
有关应急大数据的空间分析与多因素关联挖掘的文章
面对新发重大卫生事件,必须充分认识事件的“态”,通过科学手段及个人或集体的洞察力充分预测未来的“势”,并在此基础上做出决策。本章以美国新冠肺炎疫情为研究对象,进行疫情/舆情的发展态势分析、疫情防控与人口迁徙关联分析、多准则条件下的疫情风险评估和基于SIR模型的疫情传播分析。......
2023-06-15
如果后件“C”只有类别值,自然可以想到使用此规则进行分类。典型的关联规则分类算法有CBA、CMAR和CPAR[99]。CBA是由Liu B等人提出的,是最早的也是最简单的关联规则分类算法[99]。在一些典型的分类数据集的测试中,CBA算法的实验精度高于C 4.5。但与CMAR不同的是,CPAR只选择每组中的“最好的”K个规则进行分类计算。可见,关联规则分类算法是一类基于规则的算法,其基础是频繁项目的与运算。......
2023-06-16
通过方剂数据的预处理和关联分析,挖掘出基层知名老中医马祥治疗慢性胃炎处方的药对、药组和药四对。现有寒症诊断决策原始数据集,可利用关联规则分析哪些临床表现的组合会导致不同的诊断结果。例如,现有如下中医药治疗胰腺癌的处方数据,可进行关联规则分析用药规律。表2-6癫痫用药根据眼科诊疗数据,可挖掘H52.0远视、H52.2散光、H52.4老光之间的关联情况。......
2023-11-08
研究数据为美国纽约市犯罪数据,含110609条犯罪记录,包含案发时间、案发地经纬度、隶属街区和警局区域等信息,作如下处理:①删除位置属性、时间属性、事故描述属性缺失的数据行;②从日期字段中,提取年份、月份、日期、小时、工作日以及天数,在时间属性信息的选取上,多次试验后选择小时和天数这两个信息。......
2023-06-15
社会安全事件分析也是时空关联性分析广泛应用的领域。闫密巧等提出了一种基于聚类的时空关联规则的公交犯罪挖掘算法,针对某市一个区的110报警数据库中的大量业务信息进行分析。叶文菁、吴升文则引入加权时空关联规则进行挖掘分析,试图找出公交扒窃的案发时空规律与时空犯罪模式。......
2023-06-15
布尔型关联规则处理的值都是离散的、种类化的,它显示了这些变量之间的关系。在单维的关联规则中,只涉及数据的一个维,如用户购买的物品。检查冗余的多层关联规则:挖掘多层关联规则时,由于项间的“祖先”关系,有些发现的规则将是冗余的。挖掘多维关联规则的技术。......
2023-11-08
,xm}是一组称为项的元素的集合,集合XI称为项集。关联规则是一个表达式X→Y,其中X和Y是项集且不相交,即X,YI,其中N∩Y=。为了生成频繁且高置信度的关联规则,首先要枚举所有的频繁项及其支持度。给定数据集D和用户自定义的支持度阈值minsup;其次,给定频繁项集的集合F和最小置信度minconf,关联规则挖掘的任务是找出所有频繁且置信度高的规则。......
2023-06-15
Apriori算法[3]是单维、单层、布尔关联规则挖掘算法,是最简单形式的关联规则挖掘。该算法是挖掘产生布尔关联规则频繁项目集的经典算法,对关联规则挖掘研究有着重要影响。图2.3Apriori-gen算法Apriori算法调用Apriori-gen,生成所有频繁项集,如图2.4所示。Apriori算法假定数据库驻留在内存中。Apriori算法之后,学者们不断研究其改进算法及其他思想的关联规则挖掘算法,取得了很多成果。图2.4Apriori算法图2.5找出频繁项集L后生成关联规则算法......
2023-06-16
相关推荐