如果后件“C”只有类别值,自然可以想到使用此规则进行分类。典型的关联规则分类算法有CBA、CMAR和CPAR[99]。CBA是由Liu B等人提出的,是最早的也是最简单的关联规则分类算法[99]。在一些典型的分类数据集的测试中,CBA算法的实验精度高于C 4.5。但与CMAR不同的是,CPAR只选择每组中的“最好的”K个规则进行分类计算。可见,关联规则分类算法是一类基于规则的算法,其基础是频繁项目的与运算。......
2023-06-16
令I={x1,x2,…,xm}是一组称为项(item)的元素的集合,集合X⊆I称为项集。令T={t1,t2,…,tm}为另一个由事务标识符(tid)构成的集合,集合T⊆I称为一个事务标识符集。
数据集D的一个项集支持度(support),表示为sup(X,D),即D中包含X事务的数量:
X的相对支持度是包含X的事务的比例(黄庆炬等,2007):
它是对包含X项的联合概率的一个估计。若sup(X,D)≥minsup,则称X在D中是频繁的,其中minsup是用户定义的最小支持度阈值。使用集合F表示所有频繁项集的集合,F(k)表示频繁k-项集的集合。
关联规则是一个表达式X→Y,其中X和Y是项集且不相交,即X,Y⊆I,其中N∩Y=∅(吴喜之,2012)。此处用XY表示项集X∪Y。规则的支持度(support)是X和Y同时出现事务的总数,计算公式为:
一条规则的置信度(confidence)是一个事务包含X的情况下也包含Y的条件概率(吴喜之,2012):
如果一条规则对应项集的sup(XY)≥minsup,则称该规则是频繁的。若conf(X→Y)≥minconf,则称该规则是强的,其中minconf是用户定义的最小置信度阈值。
为了生成频繁且高置信度的关联规则,首先要枚举所有的频繁项及其支持度。给定数据集D和用户自定义的支持度阈值minsup;其次,给定频繁项集的集合F和最小置信度minconf,关联规则挖掘的任务是找出所有频繁且置信度高的规则。
有关应急大数据的空间分析与多因素关联挖掘的文章
如果后件“C”只有类别值,自然可以想到使用此规则进行分类。典型的关联规则分类算法有CBA、CMAR和CPAR[99]。CBA是由Liu B等人提出的,是最早的也是最简单的关联规则分类算法[99]。在一些典型的分类数据集的测试中,CBA算法的实验精度高于C 4.5。但与CMAR不同的是,CPAR只选择每组中的“最好的”K个规则进行分类计算。可见,关联规则分类算法是一类基于规则的算法,其基础是频繁项目的与运算。......
2023-06-16
通过方剂数据的预处理和关联分析,挖掘出基层知名老中医马祥治疗慢性胃炎处方的药对、药组和药四对。现有寒症诊断决策原始数据集,可利用关联规则分析哪些临床表现的组合会导致不同的诊断结果。例如,现有如下中医药治疗胰腺癌的处方数据,可进行关联规则分析用药规律。表2-6癫痫用药根据眼科诊疗数据,可挖掘H52.0远视、H52.2散光、H52.4老光之间的关联情况。......
2023-11-08
布尔型关联规则处理的值都是离散的、种类化的,它显示了这些变量之间的关系。在单维的关联规则中,只涉及数据的一个维,如用户购买的物品。检查冗余的多层关联规则:挖掘多层关联规则时,由于项间的“祖先”关系,有些发现的规则将是冗余的。挖掘多维关联规则的技术。......
2023-11-08
对盗窃犯罪案件类别、时间段、网格编号等属性信息,选择合适的支持度和置信度阈值,进行关联规则挖掘。按照关联规则长度为3,提升度大于1.2的原则进行筛选,得到共计68条强关联规则。通过分析得到的强关联规则,推出犯罪类型、网格号与时间段这三个案件属性之间所存在的关联关系,进而推测盗窃犯罪的时空规律。......
2023-06-15
Apriori算法[3]是单维、单层、布尔关联规则挖掘算法,是最简单形式的关联规则挖掘。该算法是挖掘产生布尔关联规则频繁项目集的经典算法,对关联规则挖掘研究有着重要影响。图2.3Apriori-gen算法Apriori算法调用Apriori-gen,生成所有频繁项集,如图2.4所示。Apriori算法假定数据库驻留在内存中。Apriori算法之后,学者们不断研究其改进算法及其他思想的关联规则挖掘算法,取得了很多成果。图2.4Apriori算法图2.5找出频繁项集L后生成关联规则算法......
2023-06-16
Weka工具的关联规则挖掘过程如图2-3所示。图2-4Weka选择函数设置Apriori算法的参数如下:car如果设为真,则会挖掘类关联规则而不是全局关联规则。delta以此数值为迭代递减单位,不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。设置对规则进行排序的度量依据,可以是置信度、提升度、杠杆率、确信度。在Weka中设置了几个类似置信度的度量来衡量规则的关联程度,它们分别是,①Lift:P(A,B)/Lift=1时表示A和B独立。......
2023-11-08
图4-41羽状针法工艺图图1.22并联式模式切换规则文献[78,79]中对构型相对更为复杂的同轴并联构型的混合动力车辆的模式选择问题进行了研究,将模式选择模块以有限状态机的形式展现,首先对各种工作模式进行分析,然后提出实用的切换条件,并基于工程经验和静态计算获得模式切换条件中的关键参数值,最终通过判定各切换条件来决定选择哪一种工作模式。......
2023-06-24
电流密度J的分布情况通过求解公式(6-1)来获得。在本节中,动静导电杆的材料采用铜,动静触头的材料采用银,电弧的电导率为银的10-4。在ANSYS有限元软件中进行静态传导电流分析,需要经过单元类型选择、定义材质属性、分配材质属性、几何模型剖分、定义边界条件、加载激励和结果处理这几个步骤。将上一步所得电流密度分布情况作为激励加载至模型上,通过有限元分析计算,可以得到灭弧室内的空间磁场分布。......
2023-06-15
相关推荐